サブグループを試す
サブグループ機能により、SIMD レベルの並列処理が可能になり、グループ内のスレッドが通信して、集合的な数学演算(16 個の数値の合計の計算など)を実行できます。これにより、スレッド間のデータ共有を非常に効率的に行うことができます。
サブグループ提案の最小限の実装は、chrome://flags/#enable-unsafe-webgpu
の「安全でない WebGPU サポート」フラグの背後でローカル テストに使用できます。
オリジン トライアルに登録すると、実際のユーザーを対象にサイトでサブグループを試すこともできます。オリジン トライアルを使用するためのサイトの準備手順については、オリジン トライアルのスタートガイドをご覧ください。オリジン トライアルは Chrome 128 から 131 まで(2025 年 2 月 19 日まで)実施されます。テストの目的をご覧ください。
"subgroups"
機能が GPUAdapter
で利用可能な場合は、この機能を含む GPUDevice
をリクエストして、WGSL でのサブグループのサポートを取得し、その minSubgroupSize
と maxSubgroupSize
の上限を確認します。
また、WGSL コードで enable subgroups;
を使用して、この拡張機能を明示的に有効にする必要があります。有効にすると、次の追加機能を利用できます。
subgroup_invocation_id
: サブグループ内のスレッドのインデックスの組み込み値。subgroup_size
: サブグループ サイズ アクセスの組み込み値。subgroupBallot(value)
:value
がアクティブな呼び出しで true の場合、subgroup_invocation_id
に対応するビットが 1 になるビットフィールドのセットを返します。それ以外の場合は 0 になります。subgroupBroadcast(value, id)
:subgroup_invocation_id
がid
と一致する呼び出しのvalue
をサブグループ内のすべての呼び出しにブロードキャストします。注:id
はコンパイル時の定数でなければなりません。
subgroupAdd
、subgroupAll
、subgroupElect
、subgroupShuffle
などの組み込み関数は、今後さらに追加される予定です。問題 354738715 をご覧ください。
サブグループ オペレーションで f16 を許可するには、"subgroups"
、"subgroups-f16"
、"shader-f16"
の各機能を備えた GPUDevice
をリクエストし、WGSL コードで enable f16, subgroups, subgroups_f16;
を使用して有効にします。
次のコード スニペットは、サブグループの可能性を試して見つけるためのベースを提供します。
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
線と点の深度バイアス設定を非推奨に
WebGPU 仕様の変更により、レンダリング パイプラインのトポロジが線または点タイプの場合に、depthBias
、depthBiasSlopeScale
、depthBiasClamp
をゼロ以外の値に設定すると、検証エラーが発生するようになりました。デベロッパーがコードを更新するのに十分な時間を確保するため、DevTools コンソールにこの今後の検証に関する警告が表示されるとともに、このような状況では値が 0 に強制的に設定されます。問題 352567424 を参照してください。
preventDefault の場合、キャプチャされていないエラーの DevTools 警告を非表示にする
DevTools コンソールで、uncapturederror
のイベント リスナーが登録され、イベント リスナー コールバック内でイベントの preventDefault()
メソッドが呼び出された場合、uncapturederror
イベントの警告が表示されなくなりました。この動作は JavaScript のイベント処理と一致します。次の例と問題 40263619 をご覧ください。
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL は、まず補間サンプリングを行い、
WGSL の interpolate
属性を使用すると、ユーザー定義の IO データの補間を管理できます。新しい補間サンプリング パラメータ first
(デフォルト)と either
を使用すると、さらに制御できるようになります。first
はプリミティブの最初の頂点の値を使用し、either
は最初の頂点または最後の頂点のいずれかを使用できます。問題 340278447 をご覧ください。
Dawn のアップデート
非同期オペレーションを処理する Dawn の WGPUFuture の実装が完了しました。主なコンセプトには、オポチュニスティック イベント処理用の wgpuInstanceProcessEvents と、コールバックの場所を定義するための WGPUCallbackMode があります。WGPUFuture は、有効期間が無限の 1 回限りのイベントを表します。wgpuInstanceWaitAny は、将来の完了またはタイムアウトを待機します。問題 42240932 を参照してください。
CompositeAlphaMode::Auto
の値は Surface::GetCapabilities()
によってレポートされなくなりました。これはまだ有効で、Surface::GetCapabilities().alphaMode[0]
と同等です。問題 292 をご覧ください。
OpenGL バックエンドで、各 Present()
呼び出しの y-flip blit を使用した Surface
がサポートされるようになりました。問題 344814083 をご覧ください。
Adapter::GetProperties()
メソッドは非推奨となり、Adapter::GetInfo()
の使用が推奨されています。
外部コントリビューターの Jaswant が、すべての CMake ファイルを書き直し、更新を容易にし、プリビルドを可能にしました。CMake プロジェクトで Dawn を使用するためのクイック スタートガイドをご覧ください。
ここでは、主なハイライトの一部のみを取り上げます。コミットの一覧をご覧ください。
WebGPU の新機能
WebGPU の新機能シリーズで取り上げたすべての内容のリスト。
Chrome 140
- デバイス リクエストがアダプターを消費する
- テクスチャ ビューが使用される場合にテクスチャを使用するための短縮形
- WGSL の textureSampleLevel が 1D テクスチャをサポート
- bgra8unorm 読み取り専用ストレージ テクスチャの使用を非推奨に
- GPUAdapter の isFallbackAdapter 属性を削除
- Dawn のアップデート
Chrome 139
- BC および ASTC 圧縮形式の 3D テクスチャのサポート
- 新しい「core-features-and-limits」機能
- WebGPU 互換モードのオリジン トライアル
- Dawn のアップデート
Chrome 138
- バッファをバインディング リソースとして使用するための省略形
- 作成時にマッピングされたバッファのサイズ要件の変更
- 最近の GPU のアーキテクチャ レポート
- GPUAdapter の isFallbackAdapter 属性を非推奨に
- Dawn のアップデート
Chrome 137
- externalTexture バインディングにテクスチャ ビューを使用
- オフセットとサイズを指定せずにバッファをコピーする
- アトミックへのポインタを使用する WGSL workgroupUniformLoad
- GPUAdapterInfo の powerPreference 属性
- GPURequestAdapterOptions compatibilityMode 属性を削除
- Dawn のアップデート
Chrome 136
- GPUAdapterInfo の isFallbackAdapter 属性
- D3D12 でのシェーダー コンパイル時間の短縮
- キャンバスの画像を保存、コピーする
- Lift 互換モードの制限事項
- Dawn のアップデート
Chrome 135
- バインド グループ レイアウトが null のパイプライン レイアウトの作成を許可
- ビューポートがレンダー ターゲットの境界を越えて拡張されることを許可
- Android で試験運用版の互換モードに簡単にアクセス
- maxInterStageShaderComponents 制限を削除
- Dawn のアップデート
Chrome 134
Chrome 133
- 追加の unorm8x4-bgra および 1 コンポーネント頂点形式
- 未定義の値で不明な上限をリクエストできるようにする
- WGSL のアライメント ルールの変更
- discard による WGSL のパフォーマンス向上
- 外部テクスチャに VideoFrame の displaySize を使用
- copyExternalImageToTexture を使用してデフォルト以外の向きの画像を処理
- デベロッパー エクスペリエンスの向上
- featureLevel で互換モードを有効にする
- 試験運用サブグループ機能のクリーンアップ
- maxInterStageShaderComponents 制限を非推奨に
- Dawn のアップデート
Chrome 132
- Texture ビューの使用状況
- 32 ビット浮動小数点テクスチャのブレンド
- GPUDevice の adapterInfo 属性
- 無効な形式でキャンバス コンテキストを構成すると JavaScript エラーが発生する
- テクスチャのフィルタリング サンプラーの制限
- サブグループのテストの拡張
- デベロッパー エクスペリエンスの向上
- 16 ビットの正規化されたテクスチャ形式の試験的なサポート
- Dawn のアップデート
Chrome 131
- WGSL でのクリップ距離
- GPUCanvasContext getConfiguration()
- ポイントとラインのプリミティブに深度バイアスを設定してはならない
- サブグループの包括的なスキャン組み込み関数
- マルチドロー間接の試験運用サポート
- シェーダー モジュール コンパイル オプション strict math
- GPUAdapter requestAdapterInfo() を削除
- Dawn のアップデート
Chrome 130
Chrome 129
Chrome 128
- サブグループのテスト
- 線と点の深度バイアスの設定を非推奨に
- preventDefault の場合、キャプチャされていないエラーの DevTools 警告を非表示
- WGSL は最初に補間サンプリングを行い、次のいずれかを行います。
- Dawn のアップデート
Chrome 127
- Android での OpenGL ES の試験運用サポート
- GPUAdapter の info 属性
- WebAssembly 相互運用性の改善
- コマンド エンコーダ エラーの改善
- Dawn のアップデート
Chrome 126
- maxTextureArrayLayers の上限を引き上げる
- Vulkan バックエンドのバッファ アップロードの最適化
- シェーダー コンパイル時間の改善
- 送信されたコマンド バッファは一意である必要があります
- Dawn のアップデート
Chrome 125
Chrome 124
Chrome 123
- WGSL での DP4a 組み込み関数のサポート
- WGSL の制限なしのポインタ パラメータ
- WGSL での複合体の逆参照の構文糖衣構文
- ステンシルと深度のアスペクトの読み取り専用状態を分離
- Dawn のアップデート
Chrome 122
Chrome 121
- Android で WebGPU をサポート
- Windows でのシェーダー コンパイルに FXC ではなく DXC を使用
- コンピューティング パスとレンダリング パスのタイムスタンプ クエリ
- シェーダー モジュールのデフォルトのエントリ ポイント
- GPUExternalTexture の色空間として display-p3 をサポート
- メモリヒープ情報
- Dawn のアップデート
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
での HTMLImageElement と ImageData のサポート- 読み書きと読み取り専用のストレージ テクスチャの試験運用サポート
- Dawn のアップデート
Chrome 117
- 頂点バッファの設定を解除する
- バインド グループの設定を解除する
- デバイスが紛失した場合に非同期パイプライン作成のエラーを抑制
- SPIR-V シェーダー モジュールの作成に関する更新
- デベロッパー エクスペリエンスの向上
- 自動生成されたレイアウトでパイプラインをキャッシュに保存する
- Dawn のアップデート
Chrome 116
- WebCodecs の統合
- GPUAdapter
requestDevice()
によって返された紛失デバイス importExternalTexture()
が呼び出された場合に動画再生をスムーズに保つ- 仕様への準拠
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 115
- サポートされている WGSL 言語拡張機能
- Direct3D 11 の試験運用版のサポート
- AC 電源でデフォルトでディスクリート GPU を取得
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 114
- JavaScript を最適化する
- 構成されていないキャンバスで getCurrentTexture() が InvalidStateError をスローする
- WGSL の更新
- Dawn のアップデート