Unterstützung für integrierte DP4a-Funktionen in WGSL
DP4a (Dot Product of 4 Elements and Accumulate) bezieht sich auf eine Reihe von GPU-Anweisungen, die häufig bei der Deep-Learning-Inferenz zur Quantisierung verwendet werden. Es führt effizient 8‑Bit-Ganzzahl-Skalarprodukte durch, um die Berechnung solcher int8-quantifizierten Modelle zu beschleunigen. So lassen sich bis zu 75 % der Speicher- und Netzwerkbandbreite einsparen und die Leistung von Machine-Learning-Modellen bei der Inferenz im Vergleich zur f32-Version verbessern. Daher wird es heute in vielen beliebten KI-Frameworks intensiv eingesetzt.
Wenn die "packed_4x8_integer_dot_product"
WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures
vorhanden ist, können Sie jetzt 32‑Bit-Ganzzahlskaläre mit 4‑Komponenten-Vektoren von 8‑Bit-Ganzzahlen als Eingaben für die Anweisungen zur Punktproduktberechnung in Ihrem WGSL-Shadercode mit den integrierten Funktionen dot4U8Packed
und dot4I8Packed
verwenden. Sie können auch Pack- und Entpackanweisungen mit verpackten 4‑Komponenten-Vektoren von 8‑Bit-Ganzzahlen mit den integrierten WGSL-Funktionen pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
und unpack4xU8
verwenden.
Es wird empfohlen, eine Anweisung zum Erforderlichen zu verwenden, um das Potenzial für die Nicht-Portierbarkeit mit requires packed_4x8_integer_dot_product;
oben im WGSL-Shadercode anzugeben. Weitere Informationen finden Sie im folgenden Beispiel und unter issue tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Ein besonderer Dank geht an das Webgrafik-Team von Intel in Shanghai, das diese Spezifikation und Implementierung bis zum Ende vorangetrieben hat.
Uneingeschränkte Zeigerparameter in WGSL
Mit der "unrestricted_pointer_parameters"
WGSL-Spracherweiterung werden die Einschränkungen für die Weitergabe von Pointern an WGSL-Funktionen gelockert:
Parameter-Pointer der Adressräume
storage
,uniform
undworkgroup
zu von Nutzern deklarierten Funktionen.Übergabe von Pointern zu Strukturelementen und Arrayelementen an vom Nutzer deklarierte Funktionen.
Weitere Informationen finden Sie unter Pointers As Function Parameters | Tour of WGSL.
Diese Funktion kann mit navigator.gpu.wgslLanguageFeatures
erkannt werden. Es wird empfohlen, immer eine Anweisung zum Erforderlichen zu verwenden, um das Potenzial für nicht tragbare requires unrestricted_pointer_parameters;
-Shader oben im WGSL-Shadercode anzugeben. Weitere Informationen finden Sie im folgenden Beispiel, in den Änderungen an der WGSL-Spezifikation und unter issue tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Syntax-Optimierung für die Dereferenzierung von Kompositen in WGSL
Wenn die "pointer_composite_access"
WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures
vorhanden ist, unterstützt Ihr WGSL-Shadercode jetzt den Zugriff auf Komponenten komplexer Datentypen mit derselben Syntax mit Punkt (.
), unabhängig davon, ob Sie direkt mit den Daten oder mit einem Verweis darauf arbeiten. So funktionierts:
Wenn
foo
ein Verweis ist:foo.bar
ist eine praktischere Schreibweise für(*foo).bar
. Normalerweise ist der Stern (*
) erforderlich, um den Verweis in eine „Referenz“ umzuwandeln, die dereferenziert werden kann. Jetzt sind sowohl Verweise als auch Referenzen jedoch viel ähnlicher und fast austauschbar.Wenn
foo
kein Verweis ist: Der Punktoperator (.
) funktioniert genau wie gewohnt, um direkt auf Elemente zuzugreifen.
Wenn pa
ein Zeiger ist, der die Startadresse eines Arrays speichert, erhalten Sie mit pa[i]
direkten Zugriff auf den Speicherort, an dem das 'i
. Element dieses Arrays gespeichert ist.
Es wird empfohlen, eine Anweisung zum Erforderlichen zu verwenden, um das Potenzial für die Nicht-Portierbarkeit mit requires pointer_composite_access;
oben im WGSL-Shadercode anzugeben. Siehe das folgende Beispiel und issue tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Separater Lesezugriffsstatus für Stencil- und Tiefenansichten
Bisher mussten bei schreibgeschützten Tiefen-/Masken-Anhängen in Rendering-Pässen beide Aspekte (Tiefe und Maske) schreibgeschützt sein. Diese Einschränkung wurde aufgehoben. Sie können den Tiefenbereich jetzt schreibgeschützt verwenden, z. B. für das Zeichnen von Kontaktschatten, während der Stencil-Puffer geschrieben wird, um Pixel für die weitere Verarbeitung zu identifizieren. Siehe Problem dawn:2146.
Dawn-Updates
Der mit wgpuDeviceSetUncapturedErrorCallback()
festgelegte Callback für nicht erfasste Fehler wird jetzt sofort aufgerufen, wenn der Fehler auftritt. Das ist es, was Entwickler bei der Fehlerbehebung erwarten und wünschen. Siehe change dawn:173620.
Die Methode wgpuSurfaceGetPreferredFormat()
aus der webgpu.h API wurde implementiert. Siehe Problem dawn:1362.
Dies sind nur einige der wichtigsten Highlights. Eine vollständige Liste der Commits
Das ist neu bei WebGPU
Eine Liste aller Themen, die in der Reihe Was ist neu in WebGPU behandelt wurden.
Chrome 131
- Entfernungen in WGSL zuschneiden
- GPUCanvasContext getConfiguration()
- Punkt- und Linienprimitive dürfen keine Tiefenverzerrung haben.
- Integrierte Funktionen für inklusiven Scan für Untergruppen
- Experimentelle Unterstützung für indirekte Multi-Draw-Anweisungen
- Shader-Modul-Kompilierungsoption „strict math“
- GPUAdapter-Methode „requestAdapterInfo()“ entfernen
- Updates zu Dawn
Chrome 130
- Zusammenführen von zwei Quellen
- Verbesserte Shader-Kompilierungszeiten unter Metal
- Einstellung der GPUAdapter-Methode „requestAdapterInfo()“
- Updates zu Dawn
Chrome 129
- HDR-Unterstützung mit Canvas-Tone-Mapping-Modus
- Erweiterter Support für Untergruppen
- Updates zu Dawn
Chrome 128
- Mit Untergruppen experimentieren
- Einstellung der Tiefenverzerrung für Linien und Punkte wird eingestellt
- Nicht erfasste Fehlerwarnung in den Entwicklertools bei preventDefault ausblenden
- WGSL interpoliert zuerst die Stichprobe und
- Updates zu Dawn
Chrome 127
- Experimentelle Unterstützung für OpenGL ES auf Android-Geräten
- Attribut „info“ von „GPUAdapter“
- Verbesserungen bei der WebAssembly-Interoperabilität
- Verbesserte Fehlermeldungen beim Befehls-Encoder
- Updates zu Dawn
Chrome 126
- Limit für „maxTextureArrayLayers“ erhöht
- Optimierung des Pufferuploads für das Vulkan-Backend
- Verbesserte Shader-Kompilierungszeiten
- Eingereichte Befehlspuffere müssen eindeutig sein.
- Updates zu Dawn
Chrome 125
Chrome 124
- Lese- und Lese-/Schreibspeichertextur
- Unterstützung für Dienst- und freigegebene Worker
- Neue Attribute für Adapterinformationen
- Diverse Fehlerkorrekturen
- Updates zu Dawn
Chrome 123
- Unterstützung für integrierte DP4a-Funktionen in WGSL
- Uneingeschränkte Zeigerparameter in WGSL
- Syntax-Optimierung für die Dereferenzierung von Kompositen in WGSL
- Separater schreibgeschützter Status für Stencil- und Tiefenansichten
- Updates zu Dawn
Chrome 122
- Reichweite mit Kompatibilitätsmodus erhöhen (Funktion in Entwicklung)
- Limit für maxVertexAttributes erhöhen
- Updates zu Dawn
Chrome 121
- Unterstützung von WebGPU auf Android-Geräten
- DXC anstelle von FXC für die Shaderkompilierung unter Windows verwenden
- Zeitstempelabfragen in Compute- und Rendering-Passes
- Standardeinstiegspunkte in Shadermodule
- Unterstützung von display-p3 als GPUExternalTexture-Farbraum
- Informationen zu Speicherheaps
- Updates zu Dawn
Chrome 120
- Unterstützung von 16‑Bit-Gleitkommawerten in WGSL
- Grenzen überschreiten
- Änderungen am Tiefen-/Schatten-Status
- Aktualisierte Informationen zu Adaptern
- Quantisierung von Zeitstempelabfragen
- Funktionen für den Frühjahrsputz
Chrome 119
- Filterbare 32-Bit-Gleitkommatextur
- unorm10-10-10-2-Vertex-Format
- rgb10a2uint-Texturformat
- Updates zu Dawn
Chrome 118
- Unterstützung von HTMLImageElement und ImageData in
copyExternalImageToTexture()
- Experimentelle Unterstützung für Lese-/Schreib- und schreibgeschützte Speichertextur
- Updates zu Dawn
Chrome 117
- Vertex-Buffer zurücksetzen
- Bindungsgruppe aufheben
- Fehler bei der Erstellung einer asynchronen Pipeline bei verlorenem Gerät ignorieren
- Änderungen beim Erstellen von SPIR-V-Shadermodulen
- Entwicklerfreundlichkeit verbessern
- Pipelines mit automatisch generiertem Layout im Cache speichern
- Updates zu Dawn
Chrome 116
- WebCodecs-Integration
- Verlorenes Gerät, das von GPUAdapter
requestDevice()
zurückgegeben wurde - Videowiedergabe bei Aufruf von
importExternalTexture()
flüssig halten - Einhaltung der Spezifikation
- Entwicklerfreundlichkeit verbessern
- Updates zu Dawn
Chrome 115
- Unterstützte WGSL-Spracherweiterungen
- Experimentelle Unterstützung für Direct3D 11
- Unterstützung für diskrete GPU standardmäßig bei Wechselstromversorgung
- Entwicklerfreundlichkeit verbessern
- Updates zu Dawn
Chrome 114
- JavaScript optimieren
- Bei nicht konfiguriertem Canvas wird bei getCurrentTexture() ein InvalidStateError geworfen
- WGSL-Updates
- Updates zu Dawn