WGSL での DP4a 組み込み関数のサポート
DP4a(4 つの要素のドット積と累積)は、量子化のディープ ラーニング推論で一般的に使用される GPU 命令のセットを指します。8 ビット整数のドット積を効率的に実行し、このような int8 量子化モデルの計算を高速化します。メモリとネットワーク帯域幅を最大 75% 節約し、推論における任意の ML モデルのパフォーマンスを f32 バージョンと比較して向上させることができます。その結果、多くの一般的な AI フレームワークで広く使用されるようになりました。
navigator.gpu.wgslLanguageFeatures
に "packed_4x8_integer_dot_product"
WGSL 言語拡張機能が存在する場合、dot4U8Packed
と dot4I8Packed
の組み込み関数を使用して、WGSL シェーダー コードのドット積命令への入力として 8 ビット整数の 4 成分ベクトルのパッキングに 32 ビット整数スカラーを使用できるようになりました。pack4xI8
、pack4xU8
、pack4xI8Clamp
、pack4xU8Clamp
、unpack4xI8
、unpack4xU8
の WGSL 組み込み関数を使用して、8 ビット整数でパックされた 4 成分ベクトルでパッキングとアンパッキングの手順を使用することもできます。
WGSL シェーダー コードの先頭で requires-directive を使用して、requires packed_4x8_integer_dot_product;
での移植性の可能性を通知することをおすすめします。次の例と issue tint:1497 をご覧ください。
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
この仕様と実装を完了まで推進してくれた上海の Intel Web Graphics チームに感謝します。
WGSL の制限なしポインタ パラメータ
"unrestricted_pointer_parameters"
WGSL 言語拡張機能は、WGSL 関数に渡すことができるポインタの制限を緩和します。
storage
、uniform
、workgroup
アドレス空間のパラメータ ポインタをユーザー宣言関数に渡します。構造体メンバーと配列要素へのポインタをユーザー宣言関数に渡す。
詳細については、関数パラメータとしてのポインタ | WGSL のツアーをご覧ください。
この機能は navigator.gpu.wgslLanguageFeatures
を使用して検出できます。WGSL シェーダー コードの先頭に requires unrestricted_pointer_parameters;
を使用して移植性のない可能性を示すには、常に requires-directive を使用することをおすすめします。次の例、WGSL 仕様の変更、問題 tint:2053 をご覧ください。
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
WGSL での複合体の逆参照の構文糖衣構文
navigator.gpu.wgslLanguageFeatures
に "pointer_composite_access"
WGSL 言語拡張機能が存在する場合、WGSL シェーダー コードは、データを直接操作しているか、データへのポインタを操作しているかにかかわらず、同じドット(.
)構文を使用して複雑なデータ型のコンポーネントへのアクセスをサポートするようになりました。仕組みは次のとおりです。
foo
がポインタの場合:foo.bar
は(*foo).bar
を記述するより便利な方法です。通常、ポインタを逆参照可能な「参照」にするにはアスタリスク(*
)が必要ですが、ポインタと参照がより類似し、ほぼ交換可能になりました。foo
がポインタでない場合: ドット(.
)演算子は、メンバーに直接アクセスする場合と同じように機能します。
同様に、pa
が配列の開始アドレスを格納するポインタである場合、pa[i]
を使用すると、その配列の 'i
番目の要素が格納されているメモリ位置に直接アクセスできます。
WGSL シェーダー コードの先頭で requires-directive を使用して、requires pointer_composite_access;
での移植性の可能性を通知することをおすすめします。次の例と issue tint:2113 をご覧ください。
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
ステンシルと深度のアスペクトの読み取り専用状態を分離
以前は、レンダーパスの読み取り専用の深度ステンシル アタッチメントでは、両方の側面(深度とステンシル)が読み取り専用である必要がありました。この制限は解除されました。これで、ステンシル バッファに書き込まれたピクセルを識別して、さらに処理できるようになりました。たとえば、読み取り専用で深度アスペクトを使用して、接触影のトレースを行うことができます。問題 dawn:2146 をご覧ください。
Dawn のアップデート
wgpuDeviceSetUncapturedErrorCallback()
で設定されたキャプチャされないエラーのコールバックが、エラー発生時にすぐに呼び出されるようになりました。これは、デベロッパーがデバッグで一貫して期待し、望んでいることです。変更開始:173620 を参照してください。
webgpu.h API の wgpuSurfaceGetPreferredFormat()
メソッドが実装されました。問題 dawn:1362 を参照してください。
ここでは、主なハイライトの一部のみを取り上げます。コミットの一覧をご覧ください。
WebGPU の新機能
WebGPU の新機能シリーズで取り上げたすべての内容のリスト。
Chrome 140
- デバイス リクエストがアダプターを消費する
- テクスチャ ビューが使用される場合にテクスチャを使用するための短縮形
- WGSL の textureSampleLevel が 1D テクスチャをサポート
- bgra8unorm 読み取り専用ストレージ テクスチャの使用を非推奨に
- GPUAdapter の isFallbackAdapter 属性を削除
- Dawn のアップデート
Chrome 139
- BC および ASTC 圧縮形式の 3D テクスチャのサポート
- 新しい「core-features-and-limits」機能
- WebGPU 互換モードのオリジン トライアル
- Dawn のアップデート
Chrome 138
- バッファをバインディング リソースとして使用するための省略形
- 作成時にマッピングされたバッファのサイズ要件の変更
- 最近の GPU のアーキテクチャ レポート
- GPUAdapter の isFallbackAdapter 属性を非推奨に
- Dawn のアップデート
Chrome 137
- externalTexture バインディングにテクスチャ ビューを使用
- オフセットとサイズを指定せずにバッファをコピーする
- アトミックへのポインタを使用する WGSL workgroupUniformLoad
- GPUAdapterInfo の powerPreference 属性
- GPURequestAdapterOptions compatibilityMode 属性を削除
- Dawn のアップデート
Chrome 136
- GPUAdapterInfo の isFallbackAdapter 属性
- D3D12 でのシェーダー コンパイル時間の短縮
- キャンバスの画像を保存、コピーする
- Lift 互換モードの制限事項
- Dawn のアップデート
Chrome 135
- バインド グループ レイアウトが null のパイプライン レイアウトの作成を許可
- ビューポートがレンダー ターゲットの境界を越えて拡張されることを許可
- Android で試験運用版の互換モードに簡単にアクセス
- maxInterStageShaderComponents 制限を削除
- Dawn のアップデート
Chrome 134
Chrome 133
- 追加の unorm8x4-bgra および 1 コンポーネント頂点形式
- 未定義の値で不明な上限をリクエストできるようにする
- WGSL のアライメント ルールの変更
- discard による WGSL のパフォーマンス向上
- 外部テクスチャに VideoFrame の displaySize を使用
- copyExternalImageToTexture を使用してデフォルト以外の向きの画像を処理
- デベロッパー エクスペリエンスの向上
- featureLevel で互換モードを有効にする
- 試験運用サブグループ機能のクリーンアップ
- maxInterStageShaderComponents 制限を非推奨に
- Dawn のアップデート
Chrome 132
- Texture ビューの使用状況
- 32 ビット浮動小数点テクスチャのブレンド
- GPUDevice の adapterInfo 属性
- 無効な形式でキャンバス コンテキストを構成すると JavaScript エラーが発生する
- テクスチャのフィルタリング サンプラーの制限
- サブグループのテストの拡張
- デベロッパー エクスペリエンスの向上
- 16 ビットの正規化されたテクスチャ形式の試験的なサポート
- Dawn のアップデート
Chrome 131
- WGSL でのクリップ距離
- GPUCanvasContext getConfiguration()
- ポイントとラインのプリミティブに深度バイアスを設定してはならない
- サブグループの包括的なスキャン組み込み関数
- マルチドロー間接の試験運用サポート
- シェーダー モジュール コンパイル オプション strict math
- GPUAdapter requestAdapterInfo() を削除
- Dawn のアップデート
Chrome 130
Chrome 129
Chrome 128
- サブグループのテスト
- 線と点の深度バイアスの設定を非推奨に
- preventDefault の場合、キャプチャされていないエラーの DevTools 警告を非表示
- WGSL は最初に補間サンプリングを行い、次のいずれかを行います。
- Dawn のアップデート
Chrome 127
- Android での OpenGL ES の試験運用サポート
- GPUAdapter の info 属性
- WebAssembly 相互運用性の改善
- コマンド エンコーダ エラーの改善
- Dawn のアップデート
Chrome 126
- maxTextureArrayLayers の上限を引き上げる
- Vulkan バックエンドのバッファ アップロードの最適化
- シェーダー コンパイル時間の改善
- 送信されたコマンド バッファは一意である必要があります
- Dawn のアップデート
Chrome 125
Chrome 124
Chrome 123
- WGSL での DP4a 組み込み関数のサポート
- WGSL の制限なしのポインタ パラメータ
- WGSL での複合体の逆参照の構文糖衣構文
- ステンシルと深度のアスペクトの読み取り専用状態を分離
- Dawn のアップデート
Chrome 122
Chrome 121
- Android で WebGPU をサポート
- Windows でのシェーダー コンパイルに FXC ではなく DXC を使用
- コンピューティング パスとレンダリング パスのタイムスタンプ クエリ
- シェーダー モジュールのデフォルトのエントリ ポイント
- GPUExternalTexture の色空間として display-p3 をサポート
- メモリヒープ情報
- Dawn のアップデート
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
での HTMLImageElement と ImageData のサポート- 読み書きと読み取り専用のストレージ テクスチャの試験運用サポート
- Dawn のアップデート
Chrome 117
- 頂点バッファの設定を解除する
- バインド グループの設定を解除する
- デバイスが紛失した場合に非同期パイプライン作成のエラーを抑制
- SPIR-V シェーダー モジュールの作成に関する更新
- デベロッパー エクスペリエンスの向上
- 自動生成されたレイアウトでパイプラインをキャッシュに保存する
- Dawn のアップデート
Chrome 116
- WebCodecs の統合
- GPUAdapter
requestDevice()
によって返された紛失デバイス importExternalTexture()
が呼び出された場合に動画再生をスムーズに保つ- 仕様への準拠
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 115
- サポートされている WGSL 言語拡張機能
- Direct3D 11 の試験運用版のサポート
- AC 電源でデフォルトでディスクリート GPU を取得
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 114
- JavaScript を最適化する
- 構成されていないキャンバスで getCurrentTexture() が InvalidStateError をスローする
- WGSL の更新
- Dawn のアップデート