公開日: 2025 年 2 月 26 日
サブグループを使用して ML ワークロードを改善する
1 年間の開発とトライアルを経て、SIMD レベルの並列処理を可能にする WebGPU 機能のサブグループが利用可能になりました。これにより、ワークグループ内のスレッドが通信して、数値の合計の計算などの集合的な数学演算を実行できます。また、スレッド間のデータ共有に効率的な方法を提供します。元の提案と chromestatus エントリをご覧ください。
参考として、一部のデバイスで オリジン トライアル中に、行列ベクトル乗算シェーダーの パックされた整数ドット積に対してサブグループをベンチマークしたところ、Google Meet で 2.3 ~ 2.9 倍の速度向上が見られました。
GPUAdapter
で "subgroups"
機能が利用可能な場合は、この機能を含む GPUDevice
をリクエストして、WGSL でサブグループのサポートを取得します。subgroupMinSize
アダプタと subgroupMaxSize
アダプタの情報値を確認すると便利です。たとえば、特定のサイズのサブグループを必要とするアルゴリズムがハードコードされている場合などです。
また、コンピューティング シェーダーとフラグメント シェーダーの両方のステージで次の組み込み値にアクセスするには、enable subgroups;
を使用して WGSL コードでこの拡張機能を明示的に有効にする必要があります。
subgroup_invocation_id
: サブグループ内のスレッドのインデックスの組み込み値。subgroup_size
: サブグループ サイズ アクセスの組み込み値。
多数のサブグループ組み込み関数(subgroupAdd()
、subgroupBallot()
、subgroupBroadcast()
、subgroupShuffle()
など)により、サブグループ内の呼び出し間の効率的な通信と計算が可能になります。これらのサブグループ オペレーションは、単一命令複数スレッド(SIMT)オペレーションとして分類されます。また、呼び出しの quad で動作する quad 組み込み関数により、quad 内のデータ通信が容易になります。
"shader-f16"
と "subgroups"
の両方の特徴を持つ GPUDevice
をリクエストする場合、サブグループで f16 値を使用できます。
次のサンプルは、サブグループを調べるための出発点として最適です。このサンプルは、subgroupExclusiveMul()
組み込み関数を使用して階乗を計算するシェーダーを示しています。このシェーダーは、中間結果を伝達するためにメモリの読み取りや書き込みを行いません。
ブレンド可能な float フィルタリング可能なテクスチャ タイプのサポートを削除
"float32-blendable"
機能で 32 ビット浮動小数点テクスチャのブレンドが利用可能になったため、ブレンド可能な浮動小数点フィルタリング可能なテクスチャ型に対する誤ったサポートが削除されました。問題 364987733 をご覧ください。
Dawn のアップデート
Dawn で macOS 11 と iOS 14 が必要になり、Metal 2.3 以降のみがサポートされるようになりました。問題 381117827 をご覧ください。
wgpu::Instance
の新しい GetWGSLLanguageFeatures()
メソッドが EnumerateWGSLLanguageFeatures()
に置き換わりました。問題 368672124 を参照してください。
次のバインディング タイプには Undefined
値があり、バインディング レイアウトのデフォルト値が変更されています。問題 377820810 をご覧ください。
wgpu::BufferBindingType::Undefined
をUniform
に変更wgpu::SamplerBindingType::Undefined
をFiltering
に変更wgpu::TextureSampleType::Undefined
をFloat
に変更wgpu::StorageTextureAccess::Undefined
はWriteOnly
になりました
ここでは、主なハイライトの一部のみを取り上げます。コミットの一覧をご覧ください。
WebGPU の新機能
WebGPU の新機能シリーズで取り上げたすべての内容のリスト。
Chrome 140
- デバイス リクエストがアダプターを消費する
- テクスチャ ビューが使用される場合にテクスチャを使用するための短縮形
- WGSL の textureSampleLevel が 1D テクスチャをサポート
- bgra8unorm 読み取り専用ストレージ テクスチャの使用を非推奨に
- GPUAdapter の isFallbackAdapter 属性を削除
- Dawn のアップデート
Chrome 139
- BC および ASTC 圧縮形式の 3D テクスチャのサポート
- 新しい「core-features-and-limits」機能
- WebGPU 互換モードのオリジン トライアル
- Dawn のアップデート
Chrome 138
- バッファをバインディング リソースとして使用するための省略形
- 作成時にマッピングされたバッファのサイズ要件の変更
- 最近の GPU のアーキテクチャ レポート
- GPUAdapter の isFallbackAdapter 属性を非推奨に
- Dawn のアップデート
Chrome 137
- externalTexture バインディングにテクスチャ ビューを使用
- オフセットとサイズを指定せずにバッファをコピーする
- アトミックへのポインタを使用する WGSL workgroupUniformLoad
- GPUAdapterInfo の powerPreference 属性
- GPURequestAdapterOptions compatibilityMode 属性を削除
- Dawn のアップデート
Chrome 136
- GPUAdapterInfo の isFallbackAdapter 属性
- D3D12 でのシェーダー コンパイル時間の短縮
- キャンバスの画像を保存、コピーする
- Lift 互換モードの制限事項
- Dawn のアップデート
Chrome 135
- バインド グループ レイアウトが null のパイプライン レイアウトの作成を許可
- ビューポートがレンダー ターゲットの境界を越えて拡張されることを許可
- Android で試験運用版の互換モードに簡単にアクセス
- maxInterStageShaderComponents 制限を削除
- Dawn のアップデート
Chrome 134
Chrome 133
- 追加の unorm8x4-bgra および 1 コンポーネント頂点形式
- 未定義の値で不明な上限をリクエストできるようにする
- WGSL のアライメント ルールの変更
- discard による WGSL のパフォーマンス向上
- 外部テクスチャに VideoFrame の displaySize を使用
- copyExternalImageToTexture を使用してデフォルト以外の向きの画像を処理
- デベロッパー エクスペリエンスの向上
- featureLevel で互換モードを有効にする
- 試験運用サブグループ機能のクリーンアップ
- maxInterStageShaderComponents 制限を非推奨に
- Dawn のアップデート
Chrome 132
- Texture ビューの使用状況
- 32 ビット浮動小数点テクスチャのブレンド
- GPUDevice の adapterInfo 属性
- 無効な形式でキャンバス コンテキストを構成すると JavaScript エラーが発生する
- テクスチャのフィルタリング サンプラーの制限
- サブグループのテストの拡張
- デベロッパー エクスペリエンスの向上
- 16 ビットの正規化されたテクスチャ形式の試験的なサポート
- Dawn のアップデート
Chrome 131
- WGSL でのクリップ距離
- GPUCanvasContext getConfiguration()
- ポイントとラインのプリミティブに深度バイアスを設定してはならない
- サブグループの包括的なスキャン組み込み関数
- マルチドロー間接の試験運用サポート
- シェーダー モジュール コンパイル オプション strict math
- GPUAdapter requestAdapterInfo() を削除
- Dawn のアップデート
Chrome 130
Chrome 129
Chrome 128
- サブグループのテスト
- 線と点の深度バイアスの設定を非推奨に
- preventDefault の場合、キャプチャされていないエラーの DevTools 警告を非表示
- WGSL は最初に補間サンプリングを行い、次のいずれかを行います。
- Dawn のアップデート
Chrome 127
- Android での OpenGL ES の試験運用サポート
- GPUAdapter の info 属性
- WebAssembly 相互運用性の改善
- コマンド エンコーダ エラーの改善
- Dawn のアップデート
Chrome 126
- maxTextureArrayLayers の上限を引き上げる
- Vulkan バックエンドのバッファ アップロードの最適化
- シェーダー コンパイル時間の改善
- 送信されたコマンド バッファは一意である必要があります
- Dawn のアップデート
Chrome 125
Chrome 124
Chrome 123
- WGSL での DP4a 組み込み関数のサポート
- WGSL の制限なしのポインタ パラメータ
- WGSL での複合体の逆参照の構文糖衣構文
- ステンシルと深度のアスペクトの読み取り専用状態を分離
- Dawn のアップデート
Chrome 122
Chrome 121
- Android で WebGPU をサポート
- Windows でのシェーダー コンパイルに FXC ではなく DXC を使用
- コンピューティング パスとレンダリング パスのタイムスタンプ クエリ
- シェーダー モジュールのデフォルトのエントリ ポイント
- GPUExternalTexture の色空間として display-p3 をサポート
- メモリヒープ情報
- Dawn のアップデート
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
での HTMLImageElement と ImageData のサポート- 読み書きと読み取り専用のストレージ テクスチャの試験運用サポート
- Dawn のアップデート
Chrome 117
- 頂点バッファの設定を解除する
- バインド グループの設定を解除する
- デバイスが紛失した場合に非同期パイプライン作成のエラーを抑制
- SPIR-V シェーダー モジュールの作成に関する更新
- デベロッパー エクスペリエンスの向上
- 自動生成されたレイアウトでパイプラインをキャッシュに保存する
- Dawn のアップデート
Chrome 116
- WebCodecs の統合
- GPUAdapter
requestDevice()
によって返された紛失デバイス importExternalTexture()
が呼び出された場合に動画再生をスムーズに保つ- 仕様への準拠
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 115
- サポートされている WGSL 言語拡張機能
- Direct3D 11 の試験運用版のサポート
- AC 電源でデフォルトでディスクリート GPU を取得
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 114
- JavaScript を最適化する
- 構成されていないキャンバスで getCurrentTexture() が InvalidStateError をスローする
- WGSL の更新
- Dawn のアップデート