这次的 WebGPU 功能可能有点少,但一些重大进展即将到来!未来的版本将包含着色器编译速度改进等功能,并使用 WGPUFuture 更改实现的异步模型。
子群组(正在开发中的功能)
子群组功能可实现 SIMD 级并行性,从而使群组内的线程能够进行通信并执行集体数学运算(例如,计算 16 个数字的总和)。这提供了一种高效的跨线程数据共享形式。
现代 GPU API 支持子群组操作,但命名和实现细节各不相同。Chrome 团队已确定这些功能的共同点,目前正在努力实现此功能的标准化。如果您有任何疑问,请查看提案和评论。
chrome://flags/#enable-experimental-web-platform-features
处的“实验性 Web 平台功能”标志背后有一个最低限度的非标准化子群组实现,以便开发者可以试用并分享反馈,因为在 WebGPU 的背景下,尚未证明其具有实际优势。
当 "chromium-experimental-subgroups"
功能在 GPUAdapter
中可用时,请请求使用此功能的 GPUDevice
,以在 WGSL 中获得实验性子群组支持,并检查其 minSubgroupSize
和 maxSubgroupSize
限制。
您还需要使用 enable chromium_experimental_subgroups
在 WGSL 代码中明确启用此扩展程序。启用后,您将可以访问以下附加功能:
subgroup_invocation_id
:子群组中线程的索引的内置值。subgroup_size
:用于访问子组大小的内置值。subgroupBallot(value):
返回一组位字段,其中与subgroup_invocation_id
对应的位为 1(如果value
对于相应活跃调用为 true),否则为 0。subgroupBroadcast(value, id)
:将调用中subgroup_invocation_id
与id
相匹配的value
从调用广播到子组中的所有调用。注意:id
必须是编译时常量。
以下代码段提供了一个基础,可供您进行试验并发现子组的潜力。
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("chromium-experimental-subgroups")) {
throw new Error("Experimental subgroups support is not available");
}
// Explicitly request experimental subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["chromium-experimental-subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable chromium_experimental_subgroups;
@compute @workgroup_size(64) fn main(
@builtin(global_invocation_id) global_id : vec3u,
@builtin(subgroup_size) sg_size : u32,
@builtin(subgroup_invocation_id) sg_id : u32) {
// TODO: Use subgroupBallot() and subgroupBroadcast().
}`,
});
渲染到 3D 纹理的切片
现在,您可以在渲染通道中使用 GPURenderPassColorAttachment
中的新成员 depthSlice
直接渲染到 3D 纹理的切片,从而将功能扩展到超出常见的 2D 纹理渲染。此新增功能可让您直接渲染到 3D 纹理卷中,从而创建基于体素的场景和效果。请参阅 issue dawn:1020。
Dawn 更新
查看详尽的提交列表。
WebGPU 的新变化
WebGPU 新变化系列中涵盖的所有内容的列表。
Chrome 140
- 设备请求消耗适配器
- 使用纹理视图时使用纹理的简写形式
- WGSL textureSampleLevel 支持一维纹理
- 弃用 bgra8unorm 只读存储纹理用法
- 移除了 GPUAdapter isFallbackAdapter 属性
- Dawn 更新
Chrome 139
Chrome 138
Chrome 137
- 使用纹理视图进行 externalTexture 绑定
- 复制缓冲区,但不指定偏移量和大小
- 使用指向原子变量的指针的 WGSL workgroupUniformLoad
- GPUAdapterInfo powerPreference 属性
- 移除 GPURequestAdapterOptions compatibilityMode 属性
- Dawn 更新
Chrome 136
Chrome 135
- 允许创建具有 null bind 组布局的流水线布局
- 允许视口超出渲染目标边界
- 更轻松地访问 Android 上的实验性兼容性模式
- 移除 maxInterStageShaderComponents 限制
- Dawn 更新
Chrome 134
Chrome 133
- 新增了 unorm8x4-bgra 和 1 分量顶点格式
- 允许请求具有未定义值的未知限制
- WGSL 对齐规则变更
- 使用 discard 提高 WGSL 性能
- 针对外部纹理使用 VideoFrame displaySize
- 使用 copyExternalImageToTexture 处理具有非默认方向的图片
- 改善开发者体验
- 启用与 featureLevel 的兼容模式
- 清理实验性子群组功能
- 弃用 maxInterStageShaderComponents 限制
- Dawn 更新
Chrome 132
- 纹理视图使用情况
- 32 位浮点纹理混合
- GPUDevice adapterInfo 属性
- 使用无效格式配置画布上下文时抛出 JavaScript 错误
- 纹理的过滤采样器限制
- 扩展子群组实验
- 改善开发者体验
- 实验性支持 16 位归一化纹理格式
- Dawn 更新
Chrome 131
- 剪裁 WGSL 中的距离
- GPUCanvasContext getConfiguration()
- 点和线图元不得具有深度偏移
- 子群组的包含性扫描内置函数
- 对多重绘制间接调用的实验性支持
- 着色器模块编译选项 strict math
- 移除 GPUAdapter requestAdapterInfo()
- Dawn 更新
Chrome 130
Chrome 129
Chrome 128
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- 在 Android 上支持 WebGPU
- 在 Windows 上使用 DXC 而不是 FXC 进行着色器编译
- 计算和渲染通道中的时间戳查询
- 着色器模块的默认入口点
- 支持将 display-p3 用作 GPUExternalTexture 色彩空间
- 内存堆信息
- Dawn 更新
Chrome 120
Chrome 119
Chrome 118
Chrome 117
Chrome 116
- WebCodecs 集成
- 由 GPUAdapter
requestDevice()
返回的丢失设备 - 如果调用了
importExternalTexture()
,则保持视频播放流畅 - 规范一致性
- 改善开发者体验
- Dawn 更新
Chrome 115
Chrome 114
Chrome 113
- 在
importExternalTexture()
中使用 WebCodecs VideoFrame 来源