Novità di WebGPU (Chrome 128)

François Beaufort
François Beaufort

Sperimentare con i sottogruppi

La funzionalità dei sottogruppi consente il parallelismo a livello SIMD, permettendo ai thread all'interno di un gruppo di comunicare ed eseguire operazioni matematiche collettive (ad esempio, calcolare la somma di 16 numeri). Ciò fornisce una forma molto efficiente di condivisione dei dati tra thread.

Una implementazione minima della proposta di sottogruppi è disponibile per i test locali dietro il flag "Unsafe WebGPU Support" (Supporto WebGPU non sicuro) all'indirizzo chrome://flags/#enable-unsafe-webgpu.

Puoi anche provare i sottogruppi sul tuo sito con utenti reali registrandoti alla prova dell'origine. Leggi l'articolo Inizia a utilizzare le prove di origine per istruzioni su come preparare il tuo sito per utilizzare le prove di origine. La prova dell'origine verrà eseguita da Chrome 128 a 131 (terminerà il 19 febbraio 2025). Consulta Intenzione di sperimentare.

Quando la funzionalità "subgroups" è disponibile in un GPUAdapter, richiedi un GPUDevice con questa funzionalità per ottenere il supporto dei sottogruppi in WGSL e controllarne i limiti di minSubgroupSize e maxSubgroupSize.

Devi anche attivare esplicitamente questa estensione nel codice WGSL con enable subgroups;. Se l'opzione è abilitata, puoi accedere ai seguenti componenti aggiuntivi:

  • subgroup_invocation_id: Un valore integrato per l'indice del thread all'interno del sottogruppo.
  • subgroup_size: Un valore integrato per l'accesso alla dimensione del sottogruppo.
  • subgroupBallot(value): restituisce un insieme di campi di bit in cui il bit corrispondente a subgroup_invocation_id è 1 se value è true per la chiamata attiva e 0 altrimenti.
  • subgroupBroadcast(value, id): trasmette value dall'invocazione con subgroup_invocation_id corrispondente a id a tutte le invocazioni all'interno del sottogruppo. Nota: id deve essere una costante di compilazione.

In futuro verranno aggiunte altre funzioni integrate, come subgroupAdd, subgroupAll, subgroupElect e subgroupShuffle. Vedi problema 354738715.

Per consentire f16 nelle operazioni dei sottogruppi, richiedi una GPUDevice con le funzionalità "subgroups", "subgroups-f16" e "shader-f16", quindi attivala nel codice WGSL con enable f16, subgroups, subgroups_f16;.

Il seguente snippet di codice fornisce una base per sperimentare e scoprire il potenziale dei sottogruppi.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

Ritiro dell'impostazione della distorsione della profondità per linee e punti

Una modifica delle specifiche WebGPU fa sì che l'impostazione di depthBias, depthBiasSlopeScale e depthBiasClamp su un valore diverso da zero quando la topologia di una pipeline di rendering è di tipo linea o punto generi un errore di convalida. Per dare agli sviluppatori il tempo sufficiente per aggiornare il codice, nella console DevTools viene visualizzato un avviso relativo a questa imminente convalida, che forza anche i valori a 0 in queste circostanze. Vedi problema 352567424.

Nascondi l'avviso di DevTools relativo all'errore non acquisito se preventDefault

Nella console DevTools, gli avvisi per gli eventi uncapturederror non vengono più visualizzati se è stato registrato un listener di eventi per uncapturederror ed è stato chiamato il metodo Event preventDefault() all'interno del callback del listener di eventi. Questo comportamento corrisponde alla gestione degli eventi in JavaScript. Vedi l'esempio seguente e il problema 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

WGSL interpolate sampling first and either

L'attributo WGSL interpolate consente di gestire l'interpolazione dei dati I/O definiti dall'utente. Ora, i nuovi parametri di campionamento dell'interpolazione first (impostazione predefinita) e either ti offrono un controllo aggiuntivo: first utilizza il valore del primo vertice della primitiva, mentre either consente di utilizzare il primo o l'ultimo vertice. Vedi problema 340278447.

Aggiornamenti all'alba

L'implementazione di WGPUFuture di Dawn per gestire le operazioni asincrone è ora completata. I concetti chiave includono wgpuInstanceProcessEvents per l'elaborazione opportunistica degli eventi e WGPUCallbackMode per definire le posizioni di callback. WGPUFuture indica eventi una tantum con una durata infinita e wgpuInstanceWaitAny attende il completamento di qualsiasi futuro o un timeout. Vedi problema 42240932.

Il valore CompositeAlphaMode::Auto ora non viene segnalato da Surface::GetCapabilities(). È ancora valido ed è equivalente a Surface::GetCapabilities().alphaMode[0]. Vedi il problema 292.

Il backend OpenGL ora supporta Surface con un blit di inversione sull'asse Y per ogni chiamata Present(). Vedi problema 344814083.

Il metodo Adapter::GetProperties() è deprecato a favore dell'utilizzo di Adapter::GetInfo().

Jaswant, un collaboratore esterno, ha riscritto tutti i file CMake, rendendoli più facili da aggiornare e consentendo le pre-compilazioni. Consulta la guida rapida per l'utilizzo di Dawn nei progetti CMake.

Questi sono solo alcuni dei punti salienti. Consulta l'elenco completo dei commit.

Novità di WebGPU

Un elenco di tutti gli argomenti trattati nella serie Novità di WebGPU.

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113