Neuerungen bei der WebGPU (Chrome 128)

François Beaufort
François Beaufort

Tests mit Untergruppen

Mit der Funktion für Untergruppen wird Parallelität auf SIMD-Ebene ermöglicht. So können Threads innerhalb einer Gruppe kommunizieren und gemeinsame mathematische Operationen ausführen (z. B. die Summe von 16 Zahlen berechnen). Dies bietet eine hocheffiziente Form der Datenfreigabe zwischen Threads.

Eine minimale Implementierung des Vorschlags für Untergruppen ist für lokale Tests hinter dem Flag "Unsafe WebGPU Support" unter chrome://flags/#enable-unsafe-webgpu verfügbar.

Sie können Untergruppen auch auf Ihrer Website mit echten Nutzern testen, indem Sie sich für den Ursprungstest registrieren. Eine Anleitung zur Vorbereitung Ihrer Website für die Verwendung von Ursprungstests finden Sie unter Ursprungstests verwenden. Der Ursprungstest läuft von Chrome 128 bis 131 (endet am 19. Februar 2025). Weitere Informationen: Siehe Absicht zu experimentieren.

Wenn die Funktion "subgroups" in einem GPUAdapter verfügbar ist, fordern Sie ein GPUDevice mit dieser Funktion an, um die Unterstützung von Untergruppen in WGSL zu erhalten und die Grenzwerte für minSubgroupSize und maxSubgroupSize zu prüfen.

Außerdem müssen Sie diese Erweiterung in Ihrem WGSL-Code mit enable subgroups; explizit aktivieren. Wenn sie aktiviert ist, haben Sie Zugriff auf die folgenden Ergänzungen:

  • subgroup_invocation_id: Ein integrierter Wert für den Index des Threads innerhalb der Untergruppe.
  • subgroup_size: Ein integrierter Wert für den Zugriff auf die Untergruppengröße.
  • subgroupBallot(value): Gibt eine Reihe von Bitfeldern zurück, wobei das Bit, das subgroup_invocation_id entspricht, 1 ist, wenn value für diesen aktiven Aufruf „true“ ist, und andernfalls 0.
  • subgroupBroadcast(value, id): Überträgt den value vom Aufruf mit subgroup_invocation_id, der mit id übereinstimmt, an alle Aufrufe innerhalb der Untergruppe. Hinweis: id muss eine Compile-Zeitkonstante sein.

Weitere integrierte Funktionen wie subgroupAdd, subgroupAll, subgroupElect und subgroupShuffle werden in Zukunft hinzugefügt. Weitere Informationen zu issue 354738715.

Wenn Sie f16 in Untergruppenoperationen zulassen möchten, fordern Sie ein GPUDevice mit den "subgroups", "subgroups-f16" und "shader-f16" Funktionen an und aktivieren Sie es dann in Ihrem WGSL-Code mit enable f16, subgroups, subgroups_f16;.

Das folgende Code-Snippet bietet eine Grundlage, um mit Untergruppen zu experimentieren und ihr Potenzial zu entdecken.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

Einstellung der Tiefenverzerrung für Linien und Punkte wird eingestellt

Eine Änderung der WebGPU-Spezifikation führt dazu, dass es zu einem Validierungsfehler kommt, wenn depthBias, depthBiasSlopeScale und depthBiasClamp auf einen Wert ungleich null gesetzt werden, wenn die Topologie für eine Rendering-Pipeline ein Linien- oder Punkttyp ist. Damit Entwickler genügend Zeit haben, ihren Code zu aktualisieren, wird in der Entwicklertools-Konsole eine Warnung zu dieser bevorstehenden Validierung angezeigt. Gleichzeitig werden die Werte unter diesen Umständen auf 0 gesetzt. Weitere Informationen zu Ausgabe 352567424.

Warnung in den Entwicklertools für nicht erfasste Fehler ausblenden, wenn preventDefault

In der Entwicklertools-Konsole werden keine Warnungen für uncapturederror Ereignisse mehr angezeigt, wenn ein Ereignis-Listener für uncapturederror registriert wurde und die Methode preventDefault() des Ereignisses im Callback des Ereignis-Listeners aufgerufen wurde. Dieses Verhalten entspricht der Ereignisverarbeitung in JavaScript. Weitere Informationen finden Sie im folgenden Beispiel und unter Problem 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

WGSL-Interpolations-Sampling „first“ und „either“

Mit dem WGSL-Attribut interpolate können Sie die benutzerdefinierte Interpolation von Ein-/Ausgabedaten verwalten. Die neuen Parameter für das Interpolations-Sampling first (Standard) und either bieten Ihnen jetzt zusätzliche Kontrolle: first verwendet den Wert vom ersten Vertex des Primitivs, während either entweder den ersten oder den letzten Vertex zulässt. Weitere Informationen zu Ausgabe 340278447.

Dawn-Updates

Die Implementierung von WGPUFuture von Dawn zur Verarbeitung asynchroner Vorgänge ist jetzt abgeschlossen. Zu den wichtigsten Konzepten gehören wgpuInstanceProcessEvents für die opportunistische Ereignisverarbeitung und WGPUCallbackMode zum Definieren von Callback-Standorten. WGPUFuture steht für einmalige Ereignisse mit unbegrenzter Lebensdauer und wgpuInstanceWaitAny wartet auf den Abschluss eines beliebigen zukünftigen Ereignisses oder auf ein Zeitlimit. Weitere Informationen zu issue 42240932.

Der Wert CompositeAlphaMode::Auto wird jetzt nicht mehr von Surface::GetCapabilities() gemeldet. Er ist weiterhin gültig und entspricht Surface::GetCapabilities().alphaMode[0]. Weitere Informationen zu Ausgabe 292.

Das OpenGL-Backend unterstützt jetzt Surface mit einem Y-Flip-Blit für jeden Present()-Aufruf. Weitere Informationen zu Ausgabe 344814083.

Die Methode Adapter::GetProperties() wird nicht mehr unterstützt. Verwenden Sie stattdessen Adapter::GetInfo().

Jaswant, ein externer Mitwirkender, hat alle CMake-Dateien neu geschrieben, wodurch sie einfacher zu aktualisieren sind und Vorabversionen möglich sind. Eine Kurzanleitung zur Verwendung von Dawn in CMake-Projekten finden Sie hier.

Dies sind nur einige der wichtigsten Highlights. Eine vollständige Liste der Commits finden Sie hier.

Neues in WebGPU

Eine Liste aller Themen, die in der Reihe „Neues in WebGPU“ behandelt wurden.

Chrome 147–148

Chrome 146

Chrome 145

Chrome 144

Chrome 143

Chrome 142

Chrome 141

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113