WebGPU 的新变化 (Chrome 123)

François Beaufort

WGSL 中的 DP4a 内置函数支持

DP4a（4 元素点积和累加）是指一组通常用于深度学习推理量化的 GPU 指令。它可高效执行 8 位整数点积，从而加速此类 int8 量化模型的计算。与 f32 版本相比，它最多可节省 75% 的内存和网络带宽，并提高任何机器学习模型在推理方面的性能。因此，它现在被广泛用于许多热门 AI 框架中。

当 navigator.gpu.wgslLanguageFeatures 中存在 "packed_4x8_integer_dot_product" WGSL 语言扩展时，您现在可以使用 32 位整数标量打包 4 分量 8 位整数向量，作为 WGSL 着色器代码中点积指令的输入，并使用 dot4U8Packed 和 dot4I8Packed 内置函数。您还可以使用打包和解包指令以及打包的 4 分量 8 位整数，并搭配 pack4xI8、pack4xU8、pack4xI8Clamp、pack4xU8Clamp、unpack4xI8 和 unpack4xU8 WGSL 内置函数。

建议在 WGSL 着色器代码的顶部使用 requires-directive 来表明 requires packed_4x8_integer_dot_product; 可能存在不兼容问题。请参阅以下示例和问题 tint:1497。

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

特别感谢上海的 Intel Web 图形团队推动此规范和实现顺利完成！

WGSL 中的无限制指针形参

"unrestricted_pointer_parameters" WGSL 语言扩展放宽了对哪些指针可以传递给 WGSL 函数的限制：

storage、uniform 和 workgroup 地址空间的形参指针，指向用户声明的函数。
将指向结构成员和数组元素的指针传递给用户声明的函数。

如需详细了解，请参阅将指针作为函数参数 | WGSL 导览。

可以使用 navigator.gpu.wgslLanguageFeatures 检测此功能。建议始终在 WGSL 着色器代码的顶部使用 requires-directive 来表明 requires unrestricted_pointer_parameters; 可能存在不兼容的情况。请参阅以下示例、WGSL 规范更改和问题 tint:2053。

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

用于在 WGSL 中取消引用复合类型的语法糖

如果 navigator.gpu.wgslLanguageFeatures 中存在 "pointer_composite_access" WGSL 语言扩展，那么无论您是直接处理数据还是处理指向数据的指针，您的 WGSL 着色器代码现在都支持使用相同的点 (.) 语法来访问复杂数据类型的组件。其工作原理如下：

如果 foo 是指针：foo.bar 是 (*foo).bar 的更便捷的写法。通常情况下，需要使用星号 (*) 将指针转换为可解引用的“引用”，但现在指针和引用非常相似，几乎可以互换。
如果 foo 不是指针：点 (.) 运算符的作用与您习惯的直接访问成员的方式完全相同。

同样，如果 pa 是一个存储数组起始地址的指针，那么使用 pa[i] 可以直接访问存储该数组第 'i 个元素的内存位置。

建议在 WGSL 着色器代码的顶部使用 requires-directive 来表明 requires pointer_composite_access; 可能存在不兼容问题。请参阅以下示例和问题 tint:2113。

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

针对模板和深度方面单独设置只读状态

之前，渲染通道中的只读深度模具附件要求深度和模具方面均为只读。此限制已解除。现在，您可以只读方式使用深度方面，例如用于接触阴影追踪，同时写入模板缓冲区以识别像素以供进一步处理。请参阅问题 dawn:2146。

“黎明”更新

现在，当发生错误时，系统会立即调用使用 wgpuDeviceSetUncapturedErrorCallback() 设置的未捕获错误回调。这是开发者在调试时一直期望和想要的结果。请参阅更改 dawn:173620。

已实现 webgpu.h API 中的 wgpuSurfaceGetPreferredFormat() 方法。请参阅问题 dawn:1362。

以下仅介绍了一些关键亮点。查看详尽的提交列表。

WebGPU 最新动态

WebGPU 的新变化系列中涵盖的所有内容。

Chrome 145

Chrome 144

Chrome 143

Chrome 142

Chrome 141

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113

在 importExternalTexture() 中使用 WebCodecs VideoFrame 来源

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2024-03-12。

WebGPU 的新变化 (Chrome 123) 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。