Neuerungen bei WebGPU (Chrome 123)

François Beaufort
François Beaufort

Unterstützung von integrierten DP4a-Funktionen in WGSL

DP4a (Dot Product of 4 Elements and Accumulate) bezieht sich auf eine Reihe von GPU-Befehlen, die häufig in Deep-Learning-Inferenzen für die Quantisierung verwendet werden. Es führt effizient 8‑Bit-Ganzzahl-Punktprodukte aus, um die Berechnung solcher int8-quantisierten Modelle zu beschleunigen. Sie können bis zu 75 % des Arbeitsspeichers und der Netzwerkbandbreite einsparen und die Leistung von Machine-Learning-Modellen bei der Inferenz im Vergleich zur f32-Version verbessern. Daher wird es jetzt in vielen beliebten KI-Frameworks verwendet.

Wenn die "packed_4x8_integer_dot_product" WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures vorhanden ist, können Sie jetzt 32‑Bit-Ganzzahlskalare verwenden, die 4‑Komponenten-Vektoren von 8‑Bit-Ganzzahlen als Eingaben für die Dot-Produkt-Anweisungen in Ihrem WGSL-Shader-Code mit den integrierten Funktionen dot4U8Packed und dot4I8Packed enthalten. Sie können auch Pack- und Entpackanweisungen mit gepackten 4-Komponenten-Vektoren von 8-Bit-Ganzzahlen mit den integrierten WGSL-Funktionen pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 und unpack4xU8 verwenden.

Es wird empfohlen, oben im WGSL-Shader-Code eine requires-Anweisung zu verwenden, um auf die potenzielle Nicht-Portabilität mit requires packed_4x8_integer_dot_product; hinzuweisen. Sehen Sie sich das folgende Beispiel und issue tint:1497 an.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Ein besonderer Dank gilt dem Web Graphics-Team von Intel in Shanghai, das diese Spezifikation und Implementierung vorangetrieben hat.

Uneingeschränkte Zeigerparameter in WGSL

Die "unrestricted_pointer_parameters" WGSL-Spracherweiterung lockert die Einschränkungen für Zeiger, die an WGSL-Funktionen übergeben werden können:

  • Parameterzeiger der Adressbereiche storage, uniform und workgroup für benutzerdefinierte Funktionen.

  • Übergeben von Zeigern an Strukturmember und Arrayelemente an benutzerdefinierte Funktionen.

Weitere Informationen finden Sie unter Pointers As Function Parameters | Tour of WGSL.

Diese Funktion kann mit navigator.gpu.wgslLanguageFeatures erkannt werden. Es wird empfohlen, immer eine requires-directive zu verwenden, um das Potenzial für Nicht-Portabilität mit requires unrestricted_pointer_parameters; oben in Ihrem WGSL-Shader-Code zu signalisieren. Weitere Informationen finden Sie im folgenden Beispiel, in den WGSL-Spezifikationsänderungen und im Issue tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Syntaktischer Zucker zum Dereferenzieren von Composites in WGSL

Wenn die "pointer_composite_access" WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures vorhanden ist, unterstützt Ihr WGSL-Shadercode jetzt den Zugriff auf Komponenten komplexer Datentypen mit derselben Punkt-Syntax (.), unabhängig davon, ob Sie direkt mit den Daten oder mit einem Zeiger darauf arbeiten. So funktionierts:

  • Wenn foo ein Zeiger ist: foo.bar ist eine bequemere Möglichkeit, (*foo).bar zu schreiben. Normalerweise wäre das Sternchen (*) erforderlich, um den Zeiger in eine „Referenz“ umzuwandeln, die dereferenziert werden kann. Jetzt sind Zeiger und Referenzen jedoch viel ähnlicher und fast austauschbar.

  • Wenn foo kein Zeiger ist: Der Punktoperator (.) funktioniert genau wie gewohnt für den direkten Zugriff auf Elemente.

Wenn pa ein Zeiger ist, der die Startadresse eines Arrays speichert, erhalten Sie mit pa[i] direkten Zugriff auf den Speicherort, an dem das 'i-te Element dieses Arrays gespeichert ist.

Es wird empfohlen, oben im WGSL-Shader-Code eine requires-Anweisung zu verwenden, um auf die potenzielle Nicht-Portabilität mit requires pointer_composite_access; hinzuweisen. Hier finden Sie ein Beispiel.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Separater schreibgeschützter Status für Schablonen- und Tiefenaspekte

Bisher mussten sowohl die Tiefe als auch die Schablone schreibgeschützt sein, wenn schreibgeschützte Depth-Stencil-Anhänge in Render-Passes verwendet wurden. Diese Einschränkung wurde aufgehoben. Jetzt können Sie den Tiefenaspekt schreibgeschützt verwenden, z. B. für das Contact Shadow Tracing, während der Stencil-Puffer geschrieben wird, um Pixel für die weitere Verarbeitung zu identifizieren. Siehe Problem dawn:2146.

Dawn-Updates

Der mit wgpuDeviceSetUncapturedErrorCallback() festgelegte Callback für nicht abgefangene Fehler wird jetzt sofort aufgerufen, wenn der Fehler auftritt. Das ist es, was Entwickler für das Debugging erwarten und sich wünschen. Siehe Änderung dawn:173620.

Die Methode wgpuSurfaceGetPreferredFormat() aus der webgpu.h API wurde implementiert. Siehe Problem dawn:1362.

Dies sind nur einige der wichtigsten Neuerungen. Vollständige Liste der Commits

Neues zu WebGPU

Eine Liste mit allen Themen, die in der Reihe Neu in WebGPU behandelt wurden.

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113