Novità di WebGPU (Chrome® 123)

François Beaufort
François Beaufort

Supporto delle funzioni integrate DP4a in WGSL

DP4a (Dot Product of 4 Elements and Accumulate) si riferisce a un insieme di istruzioni GPU comunemente utilizzate nell'inferenza del deep learning per la quantizzazione. Esegue in modo efficiente prodotti scalari di interi a 8 bit per accelerare il calcolo di questi modelli quantizzati a 8 bit. Può risparmiare (fino al 75%) di memoria e larghezza di banda di rete e migliorare le prestazioni di qualsiasi modello di machine learning nell'inferenza rispetto alla versione f32. Di conseguenza, ora viene utilizzato ampiamente in molti framework di IA popolari.

Quando l'estensione del linguaggio "packed_4x8_integer_dot_product"WGSL è presente in navigator.gpu.wgslLanguageFeatures, ora puoi utilizzare scalari interi a 32 bit che impacchettano vettori a 4 componenti di interi a 8 bit come input per le istruzioni del prodotto scalare nel codice shader WGSL con le funzioni integrate dot4U8Packed e dot4I8Packed. Puoi anche utilizzare istruzioni di imballaggio e smontaggio con vettori di 4 componenti impacchettati di interi a 8 bit con le funzioni predefinite WGSL pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 e unpack4xU8.

Ti consigliamo di utilizzare una direttiva requires per segnalare la potenziale incompatibilità con requires packed_4x8_integer_dot_product; nella parte superiore del codice dello shader WGSL. Vedi l'esempio seguente e issue tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Un ringraziamento speciale al team di Web Graphics di Intel a Shanghai per aver contribuito al completamento di questa specifica e implementazione.

Parametri del cursore senza restrizioni in WGSL

L'"unrestricted_pointer_parameters"estensione del linguaggio WGSL allenta le restrizioni sui puntatori che possono essere passati alle funzioni WGSL:

  • Indirizzi di spazi dei parametri di storage, uniform e workgroup alle funzioni dichiarate dall'utente.

  • Passare puntatori ai membri della struttura e agli elementi dell'array alle funzioni dichiarate dall'utente.

Per saperne di più, consulta Indirizzi come parametri di funzione | Panoramica di WGSL.

Questa funzionalità può essere rilevata utilizzando navigator.gpu.wgslLanguageFeatures. Ti consigliamo di utilizzare sempre una direttiva requires per segnalare la potenziale incompatibilità con requires unrestricted_pointer_parameters; nella parte superiore del codice dello shader WGSL. Consulta l'esempio seguente, le modifiche alle specifiche WGSL e l'issue tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Sintassi alternativa per il dereferenziamento dei compositi in WGSL

Quando l'estensione del linguaggio "pointer_composite_access"WGSL è presente in navigator.gpu.wgslLanguageFeatures, il codice shader WGSL ora supporta l'accesso ai componenti di tipi di dati complessi utilizzando la stessa sintassi del punto (.) indipendentemente dal fatto che tu stia lavorando direttamente con i dati o con un puntatore. Ecco come funziona:

  • Se foo è un puntatore: foo.bar è un modo più pratico per scrivere (*foo).bar. In genere, l'asterisco (*) è necessario per trasformare il puntatore in un "riferimento" che può essere dereferenziato, ma ora sia i puntatori che i riferimenti sono molto più simili e quasi intercambiabili.

  • Se foo non è un puntatore: l'operatore punto (.) funziona esattamente come al solito per accedere direttamente ai membri.

Analogamente, se pa è un puntatore che memorizza l'indirizzo iniziale di un array, l'utilizzo di pa[i] ti consente di accedere direttamente alla posizione di memoria in cui è memorizzato l'elemento 'i dell'array.

Ti consigliamo di utilizzare una direttiva requires per segnalare la potenziale incompatibilità con requires pointer_composite_access; nella parte superiore del codice dello shader WGSL. Vedi l'esempio seguente e issue tint:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Stato di sola lettura separato per gli aspetti stencil e profondità

In precedenza, gli allegati di stencil di profondità di sola lettura nei passaggi di rendering richiedevano che entrambi gli aspetti (profondità e stencil) fossero di sola lettura. Questa limitazione è stata rimossa. Ora puoi utilizzare l'aspetto della profondità in modalità di sola lettura, ad esempio per il rilevamento delle ombre di contatto, mentre l'area buffer dello stencil viene scritta per identificare i pixel da elaborare ulteriormente. Vedi issue dawn:2146.

Aggiornamenti di Dawn

Il callback per gli errori non rilevati impostato con wgpuDeviceSetUncapturedErrorCallback() viene ora chiamato immediatamente quando si verifica l'errore. Questo è ciò che gli sviluppatori si aspettano e vogliono in modo coerente per il debug. Vedi change dawn:173620.

È stato implementato il metodo wgpuSurfaceGetPreferredFormat() dell'API webgpu.h. Vedi issue dawn:1362.

Sono riportati solo alcuni dei punti salienti. Consulta l'elenco completo dei commit.

Novità di WebGPU

Un elenco di tutto ciò che è stato trattato nella serie Novità di WebGPU.

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113