發布日期:2025 年 2 月 26 日
使用子群組改善機器學習工作負載
經過一年的開發和試用,我們現在推出子群組 WebGPU 功能,可啟用 SIMD 層級的平行處理。工作群組中的執行緒可藉此通訊及執行集體數學運算 (例如計算數字總和),並提供有效率的跨執行緒資料共用方法。請參閱原始提案和 chromestatus 項目。
以基準測試子群組與矩陣向量相乘著色器時,Google Meet 在某些裝置上原始試用期間,速度提升了 2.3 到 2.9 倍 (與封裝整數點積相比)。
如果 "subgroups" 功能在 GPUAdapter 中可用,請要求使用這項功能的 GPUDevice,在 WGSL 中取得子群組支援。檢查 subgroupMinSize 和 subgroupMaxSize 配接器資訊值很有幫助,舉例來說,如果您有需要特定大小子群組的硬式編碼演算法,這項檢查就很有用。
您也必須在 WGSL 程式碼中明確啟用這項擴充功能 (使用 enable subgroups;),才能在運算和片段著色器階段存取下列內建值:
subgroup_invocation_id:子群組中執行緒索引的內建值。subgroup_size:子群組大小存取的內建值。
眾多子群組內建函式 (例如 subgroupAdd()、subgroupBallot()、subgroupBroadcast()、subgroupShuffle()) 可在子群組內的呼叫之間進行有效率的通訊和運算。這些子群組作業歸類為單一指令多執行緒 (SIMT) 作業。此外,四個內建函式會對一組呼叫作業 (四元組) 執行作業,方便四元組內進行資料通訊。
要求 GPUDevice 時,如果同時具有 "shader-f16" 和 "subgroups" 功能,您就可以搭配子群組使用 f16 值。
以下範例是探索子群組的絕佳起點:這個範例顯示的著色器使用 subgroupExclusiveMul() 內建函式計算階乘,但不會讀取或寫入記憶體來傳達中繼結果。
移除可做為可混合的浮點可篩選紋理類型支援
32 位元浮點紋理混合功能現已透過 "float32-blendable" 功能提供,因此系統會移除對浮點可篩選紋理類型做為可混合紋理的錯誤支援。請參閱問題 364987733。
黎明更新
Dawn 現在需要 macOS 11 和 iOS 14,且僅支援 Metal 2.3 以上版本。請參閱問題 381117827。
wgpu::Instance 的新 GetWGSLLanguageFeatures() 方法現在會取代 EnumerateWGSLLanguageFeatures()。請參閱問題 368672124。
下列繫結類型具有 Undefined 值,且繫結版面配置中的預設值已變更。請參閱問題 377820810。
wgpu::BufferBindingType::Undefined現在是Uniformwgpu::SamplerBindingType::Undefined現在是Filteringwgpu::TextureSampleType::Undefined現在是Floatwgpu::StorageTextureAccess::Undefined現已改名為WriteOnly
這僅涵蓋部分重點。請參閱完整的提交清單。
WebGPU 最新消息
「WebGPU 最新消息」系列涵蓋的所有主題清單。
Chrome 142
Chrome 141
Chrome 140
- 裝置要求會耗用轉接器
- 使用紋理檢視畫面時,可使用紋理的簡短形式
- WGSL textureSampleLevel 支援 1D 紋理
- 淘汰 bgra8unorm 唯讀儲存空間紋理用法
- 移除 GPUAdapter isFallbackAdapter 屬性
- Dawn 最新消息
Chrome 139
Chrome 138
Chrome 137
- 使用紋理檢視區塊進行 externalTexture 繫結
- 複製緩衝區,但不指定位移和大小
- WGSL 工作群組 UniformLoad,使用指標指向原子
- GPUAdapterInfo powerPreference 屬性
- 移除 GPURequestAdapterOptions compatibilityMode 屬性
- Dawn 最新消息
Chrome 136
Chrome 135
- 允許使用空值繫結群組版面配置建立管道版面配置
- 允許檢視區塊超出算繪目標的邊界
- 在 Android 上更輕鬆存取實驗性相容模式
- 移除 maxInterStageShaderComponents 限制
- Dawn 最新消息
Chrome 134
Chrome 133
- 額外的 unorm8x4-bgra 和 1 元件頂點格式
- 允許使用未定義的值要求不明限制
- WGSL 對齊規則異動
- 使用 discard 提升 WGSL 效能
- 針對外部紋理使用 VideoFrame displaySize
- 使用 copyExternalImageToTexture 處理方向非預設的圖片
- 提升開發人員體驗
- 使用 featureLevel 啟用相容模式
- 清除實驗性子群組功能
- 淘汰 maxInterStageShaderComponents 限制
- Dawn 最新消息
Chrome 132
- 紋理檢視畫面使用方式
- 32 位元浮點紋理混合
- GPUDevice adapterInfo 屬性
- 以無效格式設定畫布內容時,會擲回 JavaScript 錯誤
- 紋理的篩選取樣器限制
- 擴大子群組實驗
- 提升開發人員體驗
- 實驗性支援 16 位元標準化紋理格式
- Dawn 最新消息
Chrome 131
- 在 WGSL 中裁剪距離
- GPUCanvasContext getConfiguration()
- 點和線條圖元不得有深度偏差
- 子群組的內建包容性掃描功能
- 實驗性支援多重繪圖間接
- 著色器模組編譯選項 strict math
- 移除 GPUAdapter requestAdapterInfo()
- Dawn 最新消息
Chrome 130
Chrome 129
Chrome 128
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- 在 Android 上支援 WebGPU
- 在 Windows 上使用 DXC 取代 FXC,編譯著色器
- 運算和算繪階段中的時間戳記查詢
- 著色器模組的預設進入點
- 支援將 display-p3 做為 GPUExternalTexture 色彩空間
- 記憶體堆積資訊
- Dawn 最新消息
Chrome 120
Chrome 119
Chrome 118
Chrome 117
Chrome 116
- 整合 WebCodecs
- GPUAdapter
requestDevice()傳回的遺失裝置 - 如果呼叫
importExternalTexture(),請確保影片播放流暢 - 規格一致性
- 提升開發人員體驗
- Dawn 最新消息
Chrome 115
Chrome 114
Chrome 113
- 在
importExternalTexture()中使用 WebCodecs VideoFrame 來源