發布日期:2025 年 2 月 26 日
使用子群組改善機器學習工作負載
經過一年的開發和試驗,我們現在推出可啟用 SIMD 層級並行的 WebGPU 功能子群組。工作群組中的執行緒可藉此通訊及執行集體數學運算 (例如計算數字總和),並提供有效率的跨執行緒資料共用方法。請參閱原始提案和 chromestatus 項目。
在原始碼試用期間,我們在部分裝置上,針對矩陣向量乘法著色器,以封裝整數點積為子群組進行基準化測試,結果顯示 Google Meet 的速度提升了 2.3 到 2.9 倍。
如果 "subgroups"
功能在 GPUAdapter
中可用,請要求使用這項功能的 GPUDevice
,在 WGSL 中取得子群組支援。檢查 subgroupMinSize
和 subgroupMaxSize
配接器資訊值很有幫助,舉例來說,如果您有需要特定大小子群組的硬式編碼演算法,這項檢查就很有用。
您也必須在 WGSL 程式碼中明確啟用這項擴充功能 (使用 enable subgroups;
),才能在運算和片段著色器階段存取下列內建值:
subgroup_invocation_id
:子群組中執行緒索引的內建值。subgroup_size
:子群組大小存取的內建值。
眾多子群組內建函式 (例如 subgroupAdd()
、subgroupBallot()
、subgroupBroadcast()
、subgroupShuffle()
) 可在子群組內的呼叫之間進行有效率的通訊和運算。這些子群組作業歸類為單一指令多執行緒 (SIMT) 作業。此外,四個內建函式會對一組呼叫作業執行操作,方便四個函式之間進行資料通訊。
要求 GPUDevice
時,如果同時具有 "shader-f16"
和 "subgroups"
功能,您就可以搭配子群組使用 f16 值。
以下範例是探索子群組的絕佳起點:這個著色器使用 subgroupExclusiveMul()
內建函式計算階乘,但不會讀取或寫入記憶體來傳達中繼結果。
移除浮點可篩選紋理類型支援,因為可混合
現在 "float32-blendable"
功能提供 32 位元浮點紋理混合,因此系統會移除對浮點可篩選紋理類型做為可混合紋理的錯誤支援。請參閱問題 364987733。
黎明更新
Dawn 現在需要 macOS 11 和 iOS 14,且僅支援 Metal 2.3 以上版本。請參閱問題 381117827。
wgpu::Instance
的新 GetWGSLLanguageFeatures()
方法現在會取代 EnumerateWGSLLanguageFeatures()
。請參閱問題 368672124。
下列繫結類型具有 Undefined
值,且繫結版面配置中的預設值已變更。請參閱問題 377820810。
wgpu::BufferBindingType::Undefined
現在是Uniform
wgpu::SamplerBindingType::Undefined
現在是Filtering
wgpu::TextureSampleType::Undefined
現在是Float
wgpu::StorageTextureAccess::Undefined
現已改名為WriteOnly
這僅涵蓋部分重點。請參閱完整的提交清單。
WebGPU 最新消息
「WebGPU 最新消息」系列涵蓋的所有主題清單。
Chrome 140
- 裝置要求會耗用轉接程式
- 使用紋理檢視畫面時,可使用紋理的簡短形式
- WGSL textureSampleLevel 支援 1D 紋理
- 淘汰 bgra8unorm 唯讀儲存空間紋理用法
- 移除 GPUAdapter isFallbackAdapter 屬性
- Dawn 更新
Chrome 139
Chrome 138
Chrome 137
- 使用紋理檢視區塊進行 externalTexture 繫結
- 複製緩衝區,但不指定位移和大小
- WGSL 工作群組 UniformLoad,使用指標指向原子
- GPUAdapterInfo powerPreference 屬性
- 移除 GPURequestAdapterOptions compatibilityMode 屬性
- Dawn 更新
Chrome 136
Chrome 135
- 允許使用空值繫結群組版面配置建立管道版面配置
- 允許檢視區塊超出算繪目標的邊界
- 在 Android 上更輕鬆存取實驗性相容模式
- 移除 maxInterStageShaderComponents 限制
- Dawn 更新
Chrome 134
Chrome 133
- 額外的 unorm8x4-bgra 和 1 元件頂點格式
- 允許使用未定義的值要求不明限制
- WGSL 對齊規則變更
- 使用 discard 提升 WGSL 效能
- 針對外部紋理使用 VideoFrame displaySize
- 使用 copyExternalImageToTexture 處理方向非預設的圖片
- 提升開發人員體驗
- 使用 featureLevel 啟用相容模式
- 清除實驗性子群組功能
- 淘汰 maxInterStageShaderComponents 限制
- Dawn 更新
Chrome 132
- 紋理檢視畫面使用方式
- 32 位元浮點紋理混合
- GPUDevice adapterInfo 屬性
- 以無效格式設定畫布內容時,會擲回 JavaScript 錯誤
- 紋理的篩選取樣器限制
- 擴大子群組實驗
- 提升開發人員體驗
- 實驗性支援 16 位元標準化紋理格式
- Dawn 更新
Chrome 131
- 在 WGSL 中裁剪距離
- GPUCanvasContext getConfiguration()
- 點和線條圖元不得有深度偏差
- 子群組的內建包容性掃描功能
- 實驗性支援多重繪圖間接
- 著色器模組編譯選項「嚴格的數學」
- 移除 GPUAdapter requestAdapterInfo()
- Dawn 更新
Chrome 130
Chrome 129
Chrome 128
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- 在 Android 上支援 WebGPU
- 在 Windows 上使用 DXC 取代 FXC,編譯著色器
- 運算和算繪傳遞中的時間戳記查詢
- 著色器模組的預設進入點
- 支援將 display-p3 做為 GPUExternalTexture 色彩空間
- 記憶體堆積資訊
- Dawn 更新
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
支援 HTMLImageElement 和 ImageData- 實驗性支援讀寫和唯讀儲存空間紋理
- Dawn 更新
Chrome 117
Chrome 116
- 整合 WebCodecs
- GPUAdapter
requestDevice()
傳回的遺失裝置 - 如果呼叫
importExternalTexture()
,請確保影片播放流暢 - 規格一致性
- 提升開發人員體驗
- Dawn 更新
Chrome 115
Chrome 114
Chrome 113
- 在
importExternalTexture()
中使用 WebCodecs VideoFrame 來源