WGSL での 16 ビット浮動小数点値のサポート
WGSL では、f16
型は IEEE-754 binary16(半精度)形式の 16 ビット浮動小数点値のセットです。つまり、従来の単精度浮動小数点数(f32
)の 32 ビットではなく、16 ビットを使用して浮動小数点数を表します。このサイズが小さくなることで、特に大量のデータを処理する場合に、パフォーマンスが大幅に向上します。
比較として、Apple M1 Pro デバイスでは、WebLLM チャット デモで使用されている Llama2 7B モデルの f16
実装は f32
実装よりも大幅に高速です。次のスクリーンショットに示すように、プレフィル速度が 28%、デコード速度が 41% 向上しています。

f32
(左)と f16
(右)の Llama2 7B モデルを使用した WebLLM チャットデモ。すべての GPU が 16 ビットの浮動小数点値をサポートしているわけではありません。"shader-f16"
機能が GPUAdapter
で利用可能になると、この機能を使用して GPUDevice
をリクエストし、半精度浮動小数点型 f16
を利用する WGSL シェーダー モジュールを作成できるようになります。この型は、enable f16;
で f16
WGSL 拡張機能を有効にした場合にのみ、WGSL シェーダー モジュールで使用できます。それ以外の場合、createShaderModule() は検証エラーを生成します。次の最小限の例と issue dawn:1510 をご覧ください。
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
次のスニペットに示すように、"shader-f16"
機能のサポートに応じて alias
を使用して、WGSL シェーダー モジュール コードで f16
型と f32
型の両方をサポートできます。
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
限界に挑戦しよう
すべてのカラー アタッチメントで、レンダリング パイプラインの出力データの 1 つのサンプル(ピクセルまたはサブピクセル)を保持するために必要な最大バイト数は、デフォルトで 32 バイトです。maxColorAttachmentBytesPerSample
上限を使用して、最大 64 個のリクエストが可能になりました。次の例と issue dawn:2036 をご覧ください。
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
すべてのプラットフォームで、ステージ間の通信に使用される maxInterStageShaderVariables
と maxInterStageShaderComponents
の上限が引き上げられました。詳しくは、問題 dawn:1448 をご覧ください。
シェーダー ステージごとに、パイプライン レイアウト全体でストレージ バッファであるバインド グループ レイアウト エントリの最大数は、デフォルトで 8 です。maxStorageBuffersPerShaderStage
上限を使用して、最大 10 個のリクエストを送信できるようになりました。問題 dawn:2159 をご覧ください。
新しい maxBindGroupsPlusVertexBuffers
上限が追加されました。これは、同時に使用されるバインド グループと頂点バッファ スロットの最大数で構成され、最も高いインデックスより下の空のスロットもカウントされます。デフォルト値は 24 です。問題 dawn:1849 をご覧ください。
深度ステンシル状態の変更
デベロッパー エクスペリエンスを向上させるため、深度ステンシル状態の depthWriteEnabled
属性と depthCompare
属性が常に必要ではなくなりました。depthWriteEnabled
は深度のあるフォーマットでのみ必要となり、depthCompare
は深度のあるフォーマットでまったく使用されない場合は不要となります。問題 dawn:2132 をご覧ください。
アダプター情報の更新
ユーザーが chrome://flags/#enable-webgpu-developer-features
で「WebGPU デベロッパー機能」フラグを有効にしている場合、requestAdapterInfo() を呼び出すと、標準以外の type
アダプターと backend
アダプターの情報属性が利用できるようになりました。type
には、「discrete GPU」、「integrated GPU」、「CPU」、「unknown」を指定できます。backend
は、「WebGPU」、「D3D11」、「D3D12」、「metal」、「vulkan」、「openGL」、「openGLES」、「null」のいずれかです。問題 dawn:2112 と 問題 dawn:2107 を参照してください。

requestAdapterInfo() の省略可能な unmaskHints
リスト パラメータが削除されました。問題 dawn:1427 をご覧ください。
タイムスタンプ クエリの量子化
タイムスタンプ クエリを使用すると、アプリケーションは GPU コマンドの実行時間をナノ秒の精度で測定できます。ただし、WebGPU 仕様では、タイミング攻撃の懸念から、タイムスタンプ クエリはオプションになっています。Chrome チームは、タイムスタンプ クエリを量子化することで、解像度を 100 マイクロ秒に減らし、精度とセキュリティのバランスを適切に保てると考えています。問題 dawn:1800 をご覧ください。
Chrome では、chrome://flags/#enable-webgpu-developer-features
で「WebGPU 開発者向け機能」のフラグを有効にすることで、タイムスタンプの量子化を無効にできます。このフラグだけでは "timestamp-query"
機能は有効になりません。実装はまだ試験運用版であるため、chrome://flags/#enable-unsafe-webgpu
で「安全でない WebGPU サポート」フラグが必要です。
Dawn では、「timestamp_quantization」という新しいデバイス切り替えが追加され、デフォルトで有効になっています。次のスニペットは、デバイスをリクエストするときに、タイムスタンプの量子化なしで試験運用版の「timestamp-query」機能を有効にする方法を示しています。
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
春の大掃除機能
試験運用版の「timestamp-query-inside-passes」機能の名前が「chromium-experimental-timestamp-query-inside-passes」に変更されました。これは、この機能が試験運用版であり、現時点では Chromium ベースのブラウザでのみ利用可能であることをデベロッパーに明確にするためです。問題 dawn:1193 をご覧ください。
試験運用版の「pipeline-statistics-query」機能は、部分的にしか実装されておらず、開発も終了したため削除されました。問題 chromium:1177506 をご覧ください。
ここでは、主なハイライトの一部のみを取り上げます。コミットの一覧をご覧ください。
WebGPU の新機能
WebGPU の新機能シリーズで取り上げたすべての内容のリスト。
Chrome 140
- デバイス リクエストがアダプターを消費する
- テクスチャ ビューが使用される場合にテクスチャを使用するための短縮形
- WGSL の textureSampleLevel が 1D テクスチャをサポート
- bgra8unorm 読み取り専用ストレージ テクスチャの使用を非推奨に
- GPUAdapter の isFallbackAdapter 属性を削除
- Dawn のアップデート
Chrome 139
- BC および ASTC 圧縮形式の 3D テクスチャのサポート
- 新しい「core-features-and-limits」機能
- WebGPU 互換モードのオリジン トライアル
- Dawn のアップデート
Chrome 138
- バッファをバインディング リソースとして使用するための省略形
- 作成時にマッピングされたバッファのサイズ要件の変更
- 最近の GPU のアーキテクチャ レポート
- GPUAdapter の isFallbackAdapter 属性を非推奨に
- Dawn のアップデート
Chrome 137
- externalTexture バインディングにテクスチャ ビューを使用
- オフセットとサイズを指定せずにバッファをコピーする
- アトミックへのポインタを使用する WGSL workgroupUniformLoad
- GPUAdapterInfo の powerPreference 属性
- GPURequestAdapterOptions compatibilityMode 属性を削除
- Dawn のアップデート
Chrome 136
- GPUAdapterInfo の isFallbackAdapter 属性
- D3D12 でのシェーダー コンパイル時間の短縮
- キャンバスの画像を保存、コピーする
- Lift 互換モードの制限事項
- Dawn のアップデート
Chrome 135
- バインド グループ レイアウトが null のパイプライン レイアウトの作成を許可
- ビューポートがレンダー ターゲットの境界を越えて拡張されることを許可
- Android で試験運用版の互換モードに簡単にアクセス
- maxInterStageShaderComponents 制限を削除
- Dawn のアップデート
Chrome 134
Chrome 133
- 追加の unorm8x4-bgra および 1 コンポーネント頂点形式
- 未定義の値で不明な上限をリクエストできるようにする
- WGSL のアライメント ルールの変更
- discard による WGSL のパフォーマンス向上
- 外部テクスチャに VideoFrame の displaySize を使用
- copyExternalImageToTexture を使用してデフォルト以外の向きの画像を処理
- デベロッパー エクスペリエンスの向上
- featureLevel で互換モードを有効にする
- 試験運用サブグループ機能のクリーンアップ
- maxInterStageShaderComponents 制限を非推奨に
- Dawn のアップデート
Chrome 132
- Texture ビューの使用状況
- 32 ビット浮動小数点テクスチャのブレンド
- GPUDevice の adapterInfo 属性
- 無効な形式でキャンバス コンテキストを構成すると JavaScript エラーが発生する
- テクスチャのフィルタリング サンプラーの制限
- サブグループのテストの拡張
- デベロッパー エクスペリエンスの向上
- 16 ビットの正規化されたテクスチャ形式の試験的なサポート
- Dawn のアップデート
Chrome 131
- WGSL でのクリップ距離
- GPUCanvasContext getConfiguration()
- ポイントとラインのプリミティブに深度バイアスを設定してはならない
- サブグループの包括的なスキャン組み込み関数
- マルチドロー間接の試験運用サポート
- シェーダー モジュール コンパイル オプション strict math
- GPUAdapter requestAdapterInfo() を削除
- Dawn のアップデート
Chrome 130
Chrome 129
Chrome 128
- サブグループのテスト
- 線と点の深度バイアスの設定を非推奨に
- preventDefault の場合、キャプチャされていないエラーの DevTools 警告を非表示
- WGSL は最初に補間サンプリングを行い、次のいずれかを行います。
- Dawn のアップデート
Chrome 127
- Android での OpenGL ES の試験運用サポート
- GPUAdapter の info 属性
- WebAssembly 相互運用性の改善
- コマンド エンコーダ エラーの改善
- Dawn のアップデート
Chrome 126
- maxTextureArrayLayers の上限を引き上げる
- Vulkan バックエンドのバッファ アップロードの最適化
- シェーダー コンパイル時間の改善
- 送信されたコマンド バッファは一意である必要があります
- Dawn のアップデート
Chrome 125
Chrome 124
Chrome 123
- WGSL での DP4a 組み込み関数のサポート
- WGSL の制限なしのポインタ パラメータ
- WGSL での複合体の逆参照の構文糖衣構文
- ステンシルと深度のアスペクトの読み取り専用状態を分離
- Dawn のアップデート
Chrome 122
Chrome 121
- Android で WebGPU をサポート
- Windows でのシェーダー コンパイルに FXC ではなく DXC を使用
- コンピューティング パスとレンダリング パスのタイムスタンプ クエリ
- シェーダー モジュールのデフォルトのエントリ ポイント
- GPUExternalTexture の色空間として display-p3 をサポート
- メモリヒープ情報
- Dawn のアップデート
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
での HTMLImageElement と ImageData のサポート- 読み書きと読み取り専用のストレージ テクスチャの試験運用サポート
- Dawn のアップデート
Chrome 117
- 頂点バッファの設定を解除する
- バインド グループの設定を解除する
- デバイスが紛失した場合に非同期パイプライン作成のエラーを抑制
- SPIR-V シェーダー モジュールの作成に関する更新
- デベロッパー エクスペリエンスの向上
- 自動生成されたレイアウトでパイプラインをキャッシュに保存する
- Dawn のアップデート
Chrome 116
- WebCodecs の統合
- GPUAdapter
requestDevice()
によって返された紛失デバイス importExternalTexture()
が呼び出された場合に動画再生をスムーズに保つ- 仕様への準拠
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 115
- サポートされている WGSL 言語拡張機能
- Direct3D 11 の試験運用版のサポート
- AC 電源でデフォルトでディスクリート GPU を取得
- デベロッパー エクスペリエンスの向上
- Dawn のアップデート
Chrome 114
- JavaScript を最適化する
- 構成されていないキャンバスで getCurrentTexture() が InvalidStateError をスローする
- WGSL の更新
- Dawn のアップデート