WGSL 支援 DP4a 內建函式
DP4a (4 個元素的點積和累加) 是指一組 GPU 指令,通常用於深度學習推論的量化作業。可有效執行 8 位元整數點積,加速這類 int8 量化模型的運算。與 f32 版本相比,這項技術最多可節省 75% 的記憶體和網路頻寬,並提升任何機器學習模型的推論效能。因此,現在許多熱門的 AI 架構都大量使用這項技術。
如果 navigator.gpu.wgslLanguageFeatures
中有 "packed_4x8_integer_dot_product"
WGSL 語言擴充功能,您現在可以使用 32 位元整數純量,將 8 位元整數的 4 元向量封裝為輸入內容,並透過 dot4U8Packed
和 dot4I8Packed
內建函式,在 WGSL 著色器程式碼中執行點積指令。您也可以搭配使用封裝和解封裝指令,以及封裝的 4 元件向量 (8 位元整數),並搭配 pack4xI8
、pack4xU8
、pack4xI8Clamp
、pack4xU8Clamp
、unpack4xI8
和 unpack4xU8
WGSL 內建函式。
建議在 WGSL 著色器程式碼頂端使用 requires 指令,標示 requires packed_4x8_integer_dot_product;
可能無法移植。請參閱以下範例和問題色調:1497。
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
特別感謝上海 Intel Web Graphics 團隊,他們推動這項規格和實作作業順利完成!
WGSL 中不受限制的指標參數
"unrestricted_pointer_parameters"
WGSL 語言擴充功能會放寬限制,允許將指標傳遞至 WGSL 函式:
storage
、uniform
和workgroup
位址空間的參數指標,指向使用者宣告的函式。將指標傳遞至結構體成員和陣列元素,以供使用者宣告的函式使用。
如要進一步瞭解指標,請參閱「Pointers As Function Parameters | Tour of WGSL」。
您可以使用 navigator.gpu.wgslLanguageFeatures
偵測這項功能。建議您一律使用 requires-directive,在 WGSL 著色器程式碼頂端以 requires unrestricted_pointer_parameters;
標示可能無法移植。請參閱以下範例、WGSL 規格變更和問題色調:2053。
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
WGSL 中取消參照複合項目的語法糖
如果 navigator.gpu.wgslLanguageFeatures
中有 "pointer_composite_access"
WGSL 語言擴充功能,現在無論是直接處理資料或使用資料指標,WGSL 著色器程式碼都支援使用相同的點 (.
) 語法存取複雜資料類型的元件。運作方式如下:
如果
foo
是指標:foo.bar
是更方便的(*foo).bar
寫法。通常需要星號 (*
) 將指標轉換為可取消參照的「參照」,但現在指標和參照更為相似,幾乎可以互換。如果
foo
不是指標:點號 (.
) 運算子的運作方式與您習慣的直接存取成員相同。
同樣地,如果 pa
是儲存陣列起始位址的指標,則使用 pa[i]
可直接存取儲存該陣列第 'i
個元素的記憶體位置。
建議在 WGSL 著色器程式碼頂端使用 requires 指令,標示 requires pointer_composite_access;
可能無法移植。請參閱以下範例和問題色調:2113。
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
樣板和深度層面的唯讀狀態
先前,算繪通道中的唯讀深度樣板附件需要同時具備這兩項特質 (深度和樣板),才能設為唯讀。這項限制已解除。現在,您可以唯讀使用深度方面,例如追蹤接觸陰影,同時寫入模板緩衝區,以識別像素進行後續處理。請參閱問題 dawn:2146。
黎明更新
現在發生錯誤時,系統會立即呼叫使用 wgpuDeviceSetUncapturedErrorCallback()
設定的未擷取錯誤回呼。這正是開發人員在偵錯時一貫的期望和需求。請參閱變更 dawn:173620。
已實作 webgpu.h API 的 wgpuSurfaceGetPreferredFormat()
方法。請參閱問題 dawn:1362。
這僅涵蓋部分重點。請參閱完整的提交清單。
WebGPU 最新消息
「WebGPU 最新消息」系列涵蓋的所有主題清單。
Chrome 140
- 裝置要求會耗用轉接程式
- 使用紋理檢視畫面時,可使用紋理的簡短形式
- WGSL textureSampleLevel 支援 1D 紋理
- 淘汰 bgra8unorm 唯讀儲存空間紋理用法
- 移除 GPUAdapter isFallbackAdapter 屬性
- Dawn 更新
Chrome 139
Chrome 138
Chrome 137
- 使用紋理檢視區塊進行 externalTexture 繫結
- 複製緩衝區,但不指定位移和大小
- WGSL 工作群組 UniformLoad,使用指標指向原子
- GPUAdapterInfo powerPreference 屬性
- 移除 GPURequestAdapterOptions compatibilityMode 屬性
- Dawn 更新
Chrome 136
Chrome 135
- 允許使用空值繫結群組版面配置建立管道版面配置
- 允許檢視區塊超出算繪目標的邊界
- 在 Android 上更輕鬆存取實驗性相容模式
- 移除 maxInterStageShaderComponents 限制
- Dawn 更新
Chrome 134
Chrome 133
- 額外的 unorm8x4-bgra 和 1 元件頂點格式
- 允許使用未定義的值要求不明限制
- WGSL 對齊規則變更
- 使用 discard 提升 WGSL 效能
- 針對外部紋理使用 VideoFrame displaySize
- 使用 copyExternalImageToTexture 處理方向非預設的圖片
- 提升開發人員體驗
- 使用 featureLevel 啟用相容模式
- 清除實驗性子群組功能
- 淘汰 maxInterStageShaderComponents 限制
- Dawn 更新
Chrome 132
- 紋理檢視畫面使用方式
- 32 位元浮點紋理混合
- GPUDevice adapterInfo 屬性
- 以無效格式設定畫布內容時,會擲回 JavaScript 錯誤
- 紋理的篩選取樣器限制
- 擴大子群組實驗
- 提升開發人員體驗
- 實驗性支援 16 位元標準化紋理格式
- Dawn 更新
Chrome 131
- 在 WGSL 中裁剪距離
- GPUCanvasContext getConfiguration()
- 點和線條圖元不得有深度偏差
- 子群組的內建包容性掃描功能
- 實驗性支援多重繪圖間接
- 著色器模組編譯選項「嚴格的數學」
- 移除 GPUAdapter requestAdapterInfo()
- Dawn 更新
Chrome 130
Chrome 129
Chrome 128
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- 在 Android 上支援 WebGPU
- 在 Windows 上使用 DXC 取代 FXC,編譯著色器
- 運算和算繪傳遞中的時間戳記查詢
- 著色器模組的預設進入點
- 支援將 display-p3 做為 GPUExternalTexture 色彩空間
- 記憶體堆積資訊
- Dawn 更新
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
支援 HTMLImageElement 和 ImageData- 實驗性支援讀寫和唯讀儲存空間紋理
- Dawn 更新
Chrome 117
Chrome 116
- 整合 WebCodecs
- GPUAdapter
requestDevice()
傳回的遺失裝置 - 如果呼叫
importExternalTexture()
,請確保影片播放流暢 - 規格一致性
- 提升開發人員體驗
- Dawn 更新
Chrome 115
Chrome 114
Chrome 113
- 在
importExternalTexture()
中使用 WebCodecs VideoFrame 來源