Novità di WebGPU (Chrome® 123)

François Beaufort

Supporto delle funzioni integrate DP4a in WGSL

DP4a (Dot Product of 4 Elements and Accumulate) si riferisce a un insieme di istruzioni GPU comunemente utilizzate nell'inferenza del deep learning per la quantizzazione. Esegue in modo efficiente i prodotti scalari interi a 8 bit per accelerare il calcolo di questi modelli quantizzati int8. Può risparmiare (fino al 75%) memoria e larghezza di banda di rete e migliorare le prestazioni di qualsiasi modello di machine learning nell'inferenza rispetto alla versione f32. Di conseguenza, ora viene utilizzato molto in molti framework di AI popolari.

Quando l'estensione del linguaggio "packed_4x8_integer_dot_product" WGSL è presente in navigator.gpu.wgslLanguageFeatures, ora puoi utilizzare scalari interi a 32 bit che contengono vettori a 4 componenti di numeri interi a 8 bit come input per le istruzioni del prodotto scalare nel codice shader WGSL con le funzioni integrate dot4U8Packed e dot4I8Packed. Puoi anche utilizzare le istruzioni di packing e unpacking con vettori di 4 componenti compressi di numeri interi a 8 bit con le funzioni integrate pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 e unpack4xU8 di WGSL.

Ti consigliamo di utilizzare una direttiva requires per segnalare la potenziale non portabilità con requires packed_4x8_integer_dot_product; nella parte superiore del codice dello shader WGSL. Vedi l'esempio seguente e il problema tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Un ringraziamento speciale al team Web Graphics di Intel a Shanghai per aver portato a termine questa specifica e implementazione.

Parametri del puntatore senza restrizioni in WGSL

L'"unrestricted_pointer_parameters"estensione del linguaggio WGSL allenta le restrizioni sui puntatori che possono essere passati alle funzioni WGSL:

Puntatori ai parametri degli spazi di indirizzi storage, uniform e workgroup alle funzioni dichiarate dall'utente.
Passaggio di puntatori a membri di strutture ed elementi di array a funzioni dichiarate dall'utente.

Per saperne di più, consulta Pointers As Function Parameters | Tour of WGSL.

Questa funzionalità può essere rilevata utilizzando navigator.gpu.wgslLanguageFeatures. Ti consigliamo di utilizzare sempre una direttiva requires per segnalare la potenziale non portabilità con requires unrestricted_pointer_parameters; nella parte superiore del codice dello shader WGSL. Consulta l'esempio seguente, le modifiche alle specifiche WGSL e il problema tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Zucchero sintattico per la dereferenziazione dei compositi in WGSL

Quando l'estensione del linguaggio "pointer_composite_access"WGSL è presente in navigator.gpu.wgslLanguageFeatures, il codice shader WGSL ora supporta l'accesso ai componenti di tipi di dati complessi utilizzando la stessa sintassi con il punto (.), sia che tu stia lavorando direttamente con i dati sia con un puntatore. Ecco come funziona:

Se foo è un puntatore: foo.bar è un modo più comodo per scrivere (*foo).bar. L'asterisco (*) normalmente è necessario per trasformare il puntatore in un "riferimento" che può essere dereferenzato, ma ora i puntatori e i riferimenti sono molto più simili e quasi intercambiabili.
Se foo non è un puntatore: l'operatore punto (.) funziona esattamente come di consueto per l'accesso diretto ai membri.

Analogamente, se pa è un puntatore che memorizza l'indirizzo iniziale di un array, l'utilizzo di pa[i] consente di accedere direttamente alla posizione di memoria in cui è memorizzato l''i° elemento dell'array.

Ti consigliamo di utilizzare una direttiva requires per segnalare la potenziale non portabilità con requires pointer_composite_access; nella parte superiore del codice dello shader WGSL. Vedi l'esempio seguente e il problema tint:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Stato di sola lettura separato per gli aspetti stencil e profondità

In precedenza, gli allegati di profondità-stencil di sola lettura nei pass di rendering richiedevano che entrambi gli aspetti (profondità e stencil) fossero di sola lettura. Questa limitazione è stata rimossa. Ora puoi utilizzare l'aspetto della profondità in modalità di sola lettura, ad esempio per il tracciamento dell'ombra di contatto, mentre il buffer stencil viene scritto per identificare i pixel per l'ulteriore elaborazione. Vedi issue dawn:2146.

Aggiornamenti di Dawn

La callback di errore non acquisito impostata con wgpuDeviceSetUncapturedErrorCallback() viene ora chiamata immediatamente quando si verifica l'errore. Questo è ciò che gli sviluppatori si aspettano e desiderano costantemente per il debug. Vedi change dawn:173620.