WebGPU の新機能(Chrome 128)

François Beaufort
François Beaufort

サブグループを試す

サブグループ機能により、SIMD レベルの並列処理が可能になり、グループ内のスレッドが通信して、集合的な数学演算(16 個の数値の合計の計算など)を実行できます。これにより、スレッド間のデータ共有を非常に効率的に行うことができます。

サブグループ提案の最小限の実装は、chrome://flags/#enable-unsafe-webgpu の「安全でない WebGPU サポート」フラグの背後でローカル テストに使用できます。

オリジン トライアルに登録すると、実際のユーザーを対象にサイトでサブグループを試すこともできます。オリジン トライアルを使用するためのサイトの準備手順については、オリジン トライアルのスタートガイドをご覧ください。オリジン トライアルは Chrome 128 から 131 まで(2025 年 2 月 19 日まで)実施されます。テストの目的をご覧ください。

"subgroups" 機能が GPUAdapter で利用可能な場合は、この機能を含む GPUDevice をリクエストして、WGSL でのサブグループのサポートを取得し、その minSubgroupSizemaxSubgroupSize の上限を確認します。

また、WGSL コードで enable subgroups; を使用して、この拡張機能を明示的に有効にする必要があります。有効にすると、次の追加機能を利用できます。

  • subgroup_invocation_id: サブグループ内のスレッドのインデックスの組み込み値。
  • subgroup_size: サブグループ サイズ アクセスの組み込み値。
  • subgroupBallot(value): value がアクティブな呼び出しで true の場合、subgroup_invocation_id に対応するビットが 1 になるビットフィールドのセットを返します。それ以外の場合は 0 になります。
  • subgroupBroadcast(value, id): subgroup_invocation_idid と一致する呼び出しの value をサブグループ内のすべての呼び出しにブロードキャストします。注: id はコンパイル時の定数でなければなりません。

subgroupAddsubgroupAllsubgroupElectsubgroupShuffle などの組み込み関数は、今後さらに追加される予定です。問題 354738715 をご覧ください。

サブグループ オペレーションで f16 を許可するには、"subgroups""subgroups-f16""shader-f16" の各機能を備えた GPUDevice をリクエストし、WGSL コードで enable f16, subgroups, subgroups_f16; を使用して有効にします。

次のコード スニペットは、サブグループの可能性を試して見つけるためのベースを提供します。

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

線と点の深度バイアス設定を非推奨に

WebGPU 仕様の変更により、レンダリング パイプラインのトポロジが線または点タイプの場合に、depthBiasdepthBiasSlopeScaledepthBiasClamp をゼロ以外の値に設定すると、検証エラーが発生するようになりました。デベロッパーがコードを更新するのに十分な時間を確保するため、DevTools コンソールにこの今後の検証に関する警告が表示されるとともに、このような状況では値が 0 に強制的に設定されます。問題 352567424 を参照してください。

preventDefault の場合、キャプチャされていないエラーの DevTools 警告を非表示にする

DevTools コンソールで、uncapturederror のイベント リスナーが登録され、イベント リスナー コールバック内でイベントの preventDefault() メソッドが呼び出された場合、uncapturederror イベントの警告が表示されなくなりました。この動作は JavaScript のイベント処理と一致します。次の例と問題 40263619 をご覧ください。

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

WGSL は、まず補間サンプリングを行い、

WGSL の interpolate 属性を使用すると、ユーザー定義の IO データの補間を管理できます。新しい補間サンプリング パラメータ first(デフォルト)と either を使用すると、さらに制御できるようになります。first はプリミティブの最初の頂点の値を使用し、either は最初の頂点または最後の頂点のいずれかを使用できます。問題 340278447 をご覧ください。

Dawn のアップデート

非同期オペレーションを処理する Dawn の WGPUFuture の実装が完了しました。主なコンセプトには、オポチュニスティック イベント処理用の wgpuInstanceProcessEvents と、コールバックの場所を定義するための WGPUCallbackMode があります。WGPUFuture は、有効期間が無限の 1 回限りのイベントを表します。wgpuInstanceWaitAny は、将来の完了またはタイムアウトを待機します。問題 42240932 を参照してください。

CompositeAlphaMode::Auto の値は Surface::GetCapabilities() によってレポートされなくなりました。これはまだ有効で、Surface::GetCapabilities().alphaMode[0] と同等です。問題 292 をご覧ください。

OpenGL バックエンドで、各 Present() 呼び出しの y-flip blit を使用した Surface がサポートされるようになりました。問題 344814083 をご覧ください。

Adapter::GetProperties() メソッドは非推奨となり、Adapter::GetInfo() の使用が推奨されています。

外部コントリビューターの Jaswant が、すべての CMake ファイルを書き直し、更新を容易にし、プリビルドを可能にしました。CMake プロジェクトで Dawn を使用するためのクイック スタートガイドをご覧ください。

ここでは、主なハイライトの一部のみを取り上げます。コミットの一覧をご覧ください。

WebGPU の新機能

WebGPU の新機能シリーズで取り上げたすべての内容のリスト。

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113