Unterstützung von integrierten DP4a-Funktionen in WGSL
DP4a (Dot Product of 4 Elements and Accumulate) bezieht sich auf eine Reihe von GPU-Befehlen, die häufig in Deep-Learning-Inferenzen für die Quantisierung verwendet werden. Es führt effizient 8‑Bit-Ganzzahl-Skalarprodukte aus, um die Berechnung solcher int8-quantisierten Modelle zu beschleunigen. Sie können bis zu 75 % des Arbeitsspeichers und der Netzwerkbandbreite einsparen und die Leistung von Machine-Learning-Modellen bei der Inferenz im Vergleich zur f32-Version verbessern. Daher wird es jetzt in vielen beliebten KI-Frameworks verwendet.
Wenn die "packed_4x8_integer_dot_product" WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures vorhanden ist, können Sie jetzt 32‑Bit-Ganzzahlskalare verwenden, die 4‑Komponenten-Vektoren von 8‑Bit-Ganzzahlen als Eingaben für die Dot-Produkt-Anweisungen in Ihrem WGSL-Shader-Code mit den integrierten Funktionen dot4U8Packed und dot4I8Packed enthalten. Sie können auch Pack- und Entpackanweisungen mit gepackten 4-Komponenten-Vektoren von 8-Bit-Ganzzahlen mit den integrierten WGSL-Funktionen pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 und unpack4xU8 verwenden.
Es wird empfohlen, oben im WGSL-Shadercode eine requires-Anweisung zu verwenden, um auf die potenzielle Nicht-Portabilität mit requires packed_4x8_integer_dot_product; hinzuweisen. Sehen Sie sich das folgende Beispiel und issue tint:1497 an.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Ein besonderer Dank gilt dem Web Graphics-Team von Intel in Shanghai, das diese Spezifikation und Implementierung vorangetrieben hat.
Uneingeschränkte Zeigerparameter in WGSL
Die "unrestricted_pointer_parameters" WGSL-Spracherweiterung lockert die Einschränkungen für Zeiger, die an WGSL-Funktionen übergeben werden können:
Parameterzeiger der Adressbereiche
storage,uniformundworkgroupfür benutzerdefinierte Funktionen.Übergeben von Zeigern an Strukturmember und Arrayelemente an benutzerdefinierte Funktionen.
Weitere Informationen finden Sie unter Pointers As Function Parameters | Tour of WGSL.
Diese Funktion kann mit navigator.gpu.wgslLanguageFeatures erkannt werden. Es wird empfohlen, immer eine requires-directive zu verwenden, um das Potenzial für Nicht-Portabilität mit requires unrestricted_pointer_parameters; oben in Ihrem WGSL-Shader-Code zu signalisieren. Weitere Informationen finden Sie im folgenden Beispiel, in den WGSL-Spezifikationsänderungen und im tint:2053-Problem.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Syntaktischer Zucker zum Dereferenzieren von Composites in WGSL
Wenn die "pointer_composite_access" WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures vorhanden ist, unterstützt Ihr WGSL-Shadercode jetzt den Zugriff auf Komponenten komplexer Datentypen mit derselben Punkt-Syntax (.), unabhängig davon, ob Sie direkt mit den Daten oder mit einem Zeiger darauf arbeiten. So funktionierts:
Wenn
fooein Zeiger ist, istfoo.bareine bequemere Möglichkeit,(*foo).barzu schreiben. Normalerweise wäre das Sternchen (*) erforderlich, um den Zeiger in eine „Referenz“ umzuwandeln, die dereferenziert werden kann. Jetzt sind jedoch sowohl Zeiger als auch Referenzen viel ähnlicher und fast austauschbar.Wenn
fookein Zeiger ist: Der Punktoperator (.) funktioniert genau wie gewohnt für den direkten Zugriff auf Elemente.
Wenn pa ein Zeiger ist, der die Startadresse eines Arrays speichert, erhalten Sie mit pa[i] direkten Zugriff auf den Speicherort, an dem das 'i-te Element dieses Arrays gespeichert ist.
Es wird empfohlen, oben im WGSL-Shadercode eine requires-Anweisung zu verwenden, um auf die potenzielle Nicht-Portabilität mit requires pointer_composite_access; hinzuweisen. Hier finden Sie ein Beispiel.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Separater schreibgeschützter Status für Schablonen- und Tiefenaspekte
Bisher mussten sowohl die Tiefe als auch die Schablone schreibgeschützt sein, wenn schreibgeschützte Depth-Stencil-Anhänge in Render-Passes verwendet wurden. Diese Einschränkung wurde aufgehoben. Sie können den Tiefenaspekt jetzt schreibgeschützt verwenden, z. B. für das Contact Shadow Tracing, während der Stencil-Puffer geschrieben wird, um Pixel für die weitere Verarbeitung zu identifizieren. Siehe Problem dawn:2146.
Dawn-Updates
Der mit wgpuDeviceSetUncapturedErrorCallback() festgelegte Callback für nicht abgefangene Fehler wird jetzt sofort aufgerufen, wenn der Fehler auftritt. Das ist es, was Entwickler für das Debugging erwarten und sich wünschen. Siehe Änderung dawn:173620.
Die Methode wgpuSurfaceGetPreferredFormat() aus der webgpu.h API wurde implementiert. Siehe Problem dawn:1362.
Dies sind nur einige der wichtigsten Neuerungen. Vollständige Liste der Commits
Neues zu WebGPU
Eine Liste aller Themen, die in der Reihe Neu in WebGPU behandelt wurden.
Chrome 143
- Swizzle-Vorgang für Texturkomponenten
- Entfernen der schreibgeschützten Speichertexturverwendung für bgra8unorm
- Aktualisierungen für Dawn
Chrome 142
Chrome 141
- Tint IR completed (Färbung – IR abgeschlossen)
- Analyse von Ganzzahlbereichen im WGSL-Compiler
- SPIR-V 1.4-Update für das Vulkan-Backend
- Aktualisierungen für Dawn
Chrome 140
- Geräteanfragen verbrauchen Adapter
- Abkürzung für die Verwendung von Textur, wenn die Texturansicht verwendet wird
- WGSL-Funktion „textureSampleLevel“ unterstützt 1D-Texturen
- Einstellung der Verwendung von schreibgeschützten bgra8unorm-Speichertexturen
- Entfernen des GPUAdapter-Attributs „isFallbackAdapter“
- Aktualisierungen für Dawn
Chrome 139
- Unterstützung von 3D-Texturen für BC- und ASTC-komprimierte Formate
- Neue Funktion „core-features-and-limits“
- Ursprungstest für den WebGPU-Kompatibilitätsmodus
- Aktualisierungen für Dawn
Chrome 138
- Kurzform für die Verwendung des Puffers als Bindungsressource
- Änderungen der Größenanforderungen für Puffer, die bei der Erstellung zugeordnet werden
- Architekturbericht für aktuelle GPUs
- GPUAdapter-Attribut „isFallbackAdapter“ wird nicht mehr unterstützt
- Aktualisierungen für Dawn
Chrome 137
- Texturansicht für die Bindung von „externalTexture“ verwenden
- Puffer werden ohne Angabe von Offsets und Größe kopiert
- WGSL-Funktion „workgroupUniformLoad“ mit Zeiger auf atomaren Typ
- GPUAdapterInfo-Attribut „powerPreference“
- Entfernen des Attributs „compatibilityMode“ für GPURequestAdapterOptions
- Aktualisierungen für Dawn
Chrome 136
- GPUAdapterInfo-Attribut „isFallbackAdapter“
- Verbesserte Shader-Kompilierungszeit unter D3D12
- Canvas-Bilder speichern und kopieren
- Einschränkungen für den Kompatibilitätsmodus für die Analyse der Anzeigenwirkung
- Aktualisierungen für Dawn
Chrome 135
- Erstellen von Pipeline-Layouts mit Null-Bindungsgruppen-Layout zulassen
- Zulassen, dass Viewports über die Grenzen der Renderziele hinausgehen
- Einfacherer Zugriff auf den experimentellen Kompatibilitätsmodus unter Android
- Entfernen des Limits „maxInterStageShaderComponents“
- Aktualisierungen für Dawn
Chrome 134
- Arbeitslasten für maschinelles Lernen mit Untergruppen verbessern
- Unterstützung für float-filterbare Texturtypen als blendable entfernen
- Aktualisierungen für Dawn
Chrome 133
- Zusätzliche unorm8x4-bgra- und 1-Komponenten-Vertexformate
- Anfordern unbekannter Limits mit undefiniertem Wert zulassen
- Änderungen an den WGSL-Ausrichtungsregeln
- WGSL-Leistungssteigerungen mit „discard“
- VideoFrame.displaySize für externe Texturen verwenden
- Bilder mit nicht standardmäßigen Ausrichtungen mit copyExternalImageToTexture verarbeiten
- Für die Entwicklung optimiert
- Kompatibilitätsmodus mit „featureLevel“ aktivieren
- Bereinigung experimenteller Untergruppenfunktionen
- maxInterStageShaderComponents-Limit einstellen
- Aktualisierungen für Dawn
Chrome 132
- Nutzung der Texturansicht
- Mischen von 32-Bit-Gleitkomma-Texturen
- GPUDevice-Attribut „adapterInfo“
- Beim Konfigurieren des Canvas-Kontexts mit einem ungültigen Format wird ein JavaScript-Fehler ausgegeben
- Einschränkungen für das Filtern von Samplern für Texturen
- Erweiterte Untergruppentests
- Für die Entwicklung optimiert
- Experimentelle Unterstützung für normalisierte 16‑Bit-Texturformate
- Aktualisierungen für Dawn
Chrome 131
- Clip-Distanzen in WGSL
- GPUCanvasContext.getConfiguration()
- Punkt- und Linien-Grundtypen dürfen keine Tiefenabweichung haben
- Integrierte Funktionen für inklusive Scans für Untergruppen
- Experimentelle Unterstützung für indirekte Multi-Draw-Funktion
- Kompilierungsoption für Shadermodule „strict math“
- Entfernen von GPUAdapter.requestAdapterInfo()
- Aktualisierungen für Dawn
Chrome 130
- Zusammenführen von zwei Quellen
- Verbesserungen bei der Shader-Kompilierungszeit auf Metal
- Einstellung von GPUAdapter.requestAdapterInfo()
- Aktualisierungen für Dawn
Chrome 129
- HDR-Unterstützung mit Canvas-Tone-Mapping-Modus
- Erweiterte Unterstützung für Untergruppen
- Aktualisierungen für Dawn
Chrome 128
- Mit Untergruppen experimentieren
- Festlegen des Tiefen-Bias für Linien und Punkte wird eingestellt
- Warnung zu nicht abgefangenen Fehlern in den Entwicklertools ausblenden, wenn preventDefault
- WGSL-Interpolation zuerst und entweder
- Aktualisierungen für Dawn
Chrome 127
- Experimentelle Unterstützung für OpenGL ES unter Android
- GPUAdapter-Attribut „info“
- Verbesserungen der WebAssembly-Interop-Funktion
- Verbesserte Fehlerbehebung bei der Befehlscodierung
- Aktualisierungen für Dawn
Chrome 126
- maxTextureArrayLayers-Limit erhöhen
- Optimierung des Pufferuploads für das Vulkan-Backend
- Verbesserungen bei der Shader-Kompilierungszeit
- Eingereichte Befehlspuffer müssen eindeutig sein
- Aktualisierungen für Dawn
Chrome 125
- Untergruppen (Funktion in der Entwicklung)
- In Scheibe einer 3D-Textur rendern
- Aktualisierungen für Dawn
Chrome 124
- Schreibgeschützte und Lese-/Schreibspeicher-Texturen
- Unterstützung von Service Workern und Shared Workers
- Neue Attribute für Adapterinformationen
- Diverse Fehlerkorrekturen
- Aktualisierungen für Dawn
Chrome 123
- Unterstützung von integrierten DP4a-Funktionen in WGSL
- Uneingeschränkte Zeigerparameter in WGSL
- Syntax-Zucker für das Dereferenzieren von Composites in WGSL
- Separater schreibgeschützter Status für Schablonen- und Tiefenaspekte
- Aktualisierungen für Dawn
Chrome 122
- Reichweite mit dem Kompatibilitätsmodus erhöhen (Funktion in der Entwicklung)
- Limit für „maxVertexAttributes“ erhöhen
- Aktualisierungen für Dawn
Chrome 121
- WebGPU unter Android unterstützen
- DXC anstelle von FXC für die Shader-Kompilierung unter Windows verwenden
- Zeitstempelabfragen in Compute- und Render-Passes
- Standardeinstiegspunkte für Shader-Module
- display-p3 als GPUExternalTexture-Farbraum unterstützen
- Informationen zu Speicher-Heaps
- Aktualisierungen für Dawn
Chrome 120
- Unterstützung von 16‑Bit-Gleitkommawerten in WGSL
- An die Grenzen gehen
- Änderungen am Tiefen-Stencil-Status
- Aktualisierungen der Adapterinformationen
- Quantisierung von Zeitstempelabfragen
- Funktionen für den Frühjahrsputz
Chrome 119
- Filterbare 32-Bit-Gleitkomma-Texturen
- unorm10-10-10-2-Vertexformat
- rgb10a2uint-Texturformat
- Aktualisierungen für Dawn
Chrome 118
- Unterstützung von HTMLImageElement und ImageData in
copyExternalImageToTexture() - Experimentelle Unterstützung für Lese-/Schreib- und schreibgeschützte Speichertexturen
- Aktualisierungen für Dawn
Chrome 117
- Vertex-Puffer zurücksetzen
- Bindungsgruppe aufheben
- Fehler bei der asynchronen Pipelineerstellung unterdrücken, wenn das Gerät verloren geht
- Aktualisierungen bei der Erstellung von SPIR-V-Shadermodulen
- Für die Entwicklung optimiert
- Pipelines mit automatisch generiertem Layout im Cache speichern
- Aktualisierungen für Dawn
Chrome 116
- WebCodecs-Integration
- Verlorenes Gerät, das von GPUAdapter
requestDevice()zurückgegeben wurde - Videowiedergabe flüssig halten, wenn
importExternalTexture()aufgerufen wird - Einhaltung der Spezifikationen
- Für die Entwicklung optimiert
- Aktualisierungen für Dawn
Chrome 115
- Unterstützte WGSL-Spracherweiterungen
- Experimentelle Unterstützung für Direct3D 11
- Standardmäßig diskrete GPU bei Stromversorgung über Wechselstrom
- Für die Entwicklung optimiert
- Aktualisierungen für Dawn
Chrome 114
- JavaScript optimieren
- „getCurrentTexture()“ für nicht konfigurierte Canvas-Elemente löst „InvalidStateError“ aus
- WGSL-Updates
- Aktualisierungen für Dawn