Supporto delle funzioni integrate DP4a in WGSL
DP4a (Dot Product of 4 Elements and Accumulate) si riferisce a un insieme di istruzioni GPU comunemente utilizzate nell'inferenza del deep learning per la quantizzazione. Esegue in modo efficiente prodotti scalari di interi a 8 bit per accelerare il calcolo di questi modelli quantizzati a 8 bit. Può risparmiare (fino al 75%) di memoria e larghezza di banda di rete e migliorare le prestazioni di qualsiasi modello di machine learning nell'inferenza rispetto alla versione f32. Di conseguenza, ora viene ampiamente utilizzato in molti framework di IA popolari.
Quando l'estensione del linguaggio "packed_4x8_integer_dot_product"
WGSL è presente in navigator.gpu.wgslLanguageFeatures
, ora puoi utilizzare scalari interi a 32 bit che impacchettano vettori a 4 componenti di interi a 8 bit come input per le istruzioni del prodotto scalare nel codice shader WGSL con le funzioni integrate dot4U8Packed
e dot4I8Packed
. Puoi anche utilizzare le istruzioni di pacchettizzazione e decompressione con vettori a quattro componenti compressi di numeri interi a 8 bit con funzioni integrate di pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
e unpack4xU8
WGSL.
Ti consigliamo di utilizzare una direttiva requires per segnalare la potenziale incompatibilità con requires packed_4x8_integer_dot_product;
nella parte superiore del codice dello shader WGSL. Vedi l'esempio seguente e il problema issue tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Un ringraziamento speciale al team Web Graphics di Intel di Shanghai per aver portato a termine questa specifica e implementazione.
Parametri puntatore senza limitazioni in WGSL
L'"unrestricted_pointer_parameters"
estensione del linguaggio WGSL allenta le restrizioni relative ai puntatori che possono essere passati alle funzioni WGSL:
Indirizzi di spazi dei parametri di
storage
,uniform
eworkgroup
alle funzioni dichiarate dall'utente.Passare puntatori ai membri della struttura e agli elementi dell'array alle funzioni dichiarate dall'utente.
Per saperne di più, consulta Pointers as Function Parameters | Tour di WGSL.
Questa funzionalità può essere rilevata utilizzando navigator.gpu.wgslLanguageFeatures
. Ti consigliamo di utilizzare sempre una direttiva requires per segnalare la potenziale incompatibilità con requires unrestricted_pointer_parameters;
nella parte superiore del codice dello shader WGSL. Consulta l'esempio seguente, le modifiche alle specifiche WGSL e l'issue tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Sintassi alternativa per il dereferenziamento dei compositi in WGSL
Quando l'estensione del linguaggio "pointer_composite_access"
WGSL è presente in navigator.gpu.wgslLanguageFeatures
, il codice shader WGSL ora supporta l'accesso ai componenti di tipi di dati complessi utilizzando la stessa sintassi del punto (.
) indipendentemente dal fatto che tu stia lavorando direttamente con i dati o con un puntatore. Ecco come funziona:
Se
foo
è un puntatore:foo.bar
è un modo più conveniente per scrivere(*foo).bar
. In genere, l'asterisco (*
) è necessario per trasformare il puntatore in un "riferimento" che può essere dereferenziato, ma ora sia i puntatori che i riferimenti sono molto più simili e quasi intercambiabili.Se
foo
non è un puntatore: l'operatore punto (.
) funziona esattamente come al solito per accedere direttamente ai membri.
Analogamente, se pa
è un puntatore che memorizza l'indirizzo iniziale di un array, l'utilizzo di pa[i]
ti consente di accedere direttamente alla posizione di memoria in cui è memorizzato l'elemento 'i
dell'array.
Ti consigliamo di utilizzare un'istruzione relativa ai requisiti per segnalare il potenziale di non portabilità con requires pointer_composite_access;
nella parte superiore del codice del tuo Shar WGSL. Vedi l'esempio seguente e issue tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Stato di sola lettura separato per gli aspetti stencil e profondità
In precedenza, gli allegati di stencil di profondità di sola lettura nei passaggi di rendering richiedevano che entrambi gli aspetti (profondità e stencil) fossero di sola lettura. Questa limitazione è stata rimossa. Ora puoi utilizzare l'aspetto della profondità in modalità di sola lettura, ad esempio per il rilevamento delle ombre di contatto, mentre l'area buffer dello stencil viene scritta per identificare i pixel da elaborare ulteriormente. Vedi issue dawn:2146.
Aggiornamenti di Dawn
Il callback per gli errori non rilevati impostato con wgpuDeviceSetUncapturedErrorCallback()
viene ora chiamato immediatamente quando si verifica l'errore. Questo è ciò che gli sviluppatori si aspettano e vogliono in modo coerente per il debug. Vedi change dawn:173620.
Il metodo wgpuSurfaceGetPreferredFormat()
dell'API webgpu.h è stato implementato. Vedi issue dawn:1362.
Sono riportati solo alcuni punti salienti. Consulta l'elenco completo dei commit.
Novità di WebGPU
Un elenco di tutto ciò che è stato trattato nella serie Novità di WebGPU.
Chrome 131
- Clip delle distanze in WGSL
- GPUCanvasContext getConfiguration()
- Gli elementi primitivi punto e linea non devono avere bias di profondità
- Funzioni integrate di scansione inclusiva per i sottogruppi
- Supporto sperimentale per il rendering indiretto multi-draw
- Opzione di compilazione del modulo shader matematica rigorosa
- Rimuovi requestAdapterInfo() di GPUAdapter
- Aggiornamenti di Dawn
Chrome 130
- Combinazione di due sorgenti
- Miglioramenti ai tempi di compilazione degli shader su Metal
- Obsoletezza di requestAdapterInfo() di GPUAdapter
- Aggiornamenti di Dawn
Chrome 129
- Supporto HDR con modalità di mappatura tonale della tela
- Supporto dei sottogruppi ampliato
- Aggiornamenti di Dawn
Chrome 128
- Sperimentazione con i sottogruppi
- Ritirare l'impostazione della bias di profondità per linee e punti
- Nascondere l'avviso DevTools relativo a un errore non rilevato se preventDefault
- WGSL esegue prima l'interpolazione del campionamento e poi
- Aggiornamenti di Dawn
Chrome 127
- Supporto sperimentale per OpenGL ES su Android
- Attributo info di GPUAdapter
- Miglioramenti all'interoperabilità di WebAssembly
- Errori dell'encoder dei comandi migliorati
- Aggiornamenti di Dawn
Chrome 126
- Aumenta il limite di maxTextureArrayLevel
- Ottimizzazione del caricamento del buffer per il backend Vulkan
- Miglioramenti ai tempi di compilazione degli shader
- I buffer dei comandi inviati devono essere univoci
- Aggiornamenti di Dawn
Chrome 125
- Sottogruppi (funzionalità in fase di sviluppo)
- Eseguire il rendering di una sezione della texture 3D
- Aggiornamenti di Dawn
Chrome 124
- Texture di archiviazione di sola lettura e di lettura e scrittura
- Supporto di worker di servizio e worker condivisi
- Nuovi attributi delle informazioni sull'adattatore
- Correzioni di bug
- Aggiornamenti di Dawn
Chrome 123
- Supporto delle funzioni integrate DP4a in WGSL
- Parametri del cursore non soggetti a limitazioni in WGSL
- Sintassi dello zucchero per il deriferimento dei componenti compositi in WGSL
- Stato di sola lettura separato per gli aspetti di stencil e profondità
- Aggiornamenti sull'alba
Chrome 122
- Ampliare la copertura con la modalità di compatibilità (funzionalità in fase di sviluppo)
- Aumenta il limite maxVertexAttributes
- Aggiornamenti di Dawn
Chrome 121
- Supporto di WebGPU su Android
- Utilizzare DXC anziché FXC per la compilazione degli shader su Windows
- Query sui timestamp nei passaggi di calcolo e rendering
- Punti di contatto predefiniti per i moduli shader
- Supporto di display-p3 come spazio colore GPUExternalTexture
- Informazioni sugli heap di memoria
- Aggiornamenti sull'alba
Chrome 120
- Supporto dei valori in virgola mobile a 16 bit in WGSL
- Spingere i limiti al massimo
- Modifiche allo stato Profondità dello stencil
- Aggiornamenti delle informazioni sugli adattatori
- Quantizzazione delle query con timestamp
- Funzionalità per le pulizie di primavera
Chrome 119
- Texture con formato a virgola mobile 32 bit filtrabili
- formato vertex unorm10-10-10-2
- Formato texture rgb10a2uint
- Aggiornamenti di Dawn
Chrome 118
- Supporto di HTMLImageElement e ImageData in
copyExternalImageToTexture()
- Supporto sperimentale per le texture di archiviazione in lettura/scrittura e di sola lettura
- Aggiornamenti sull'alba
Chrome 117
- Annulla impostazione vertex buffer
- Reimpostare il gruppo di associazione
- Ignorare gli errori della creazione della pipeline asincrona quando il dispositivo viene smarrito
- Aggiornamenti sulla creazione di moduli shader SPIR-V
- Miglioramento dell'esperienza degli sviluppatori
- Memorizzazione nella cache delle pipeline con layout generato automaticamente
- Aggiornamenti di Dawn
Chrome 116
- Integrazione di WebCodecs
- Dispositivo smarrito restituito da GPUAdapter
requestDevice()
- Mantenere la riproduzione video fluida se viene chiamato
importExternalTexture()
- Conformità alle specifiche
- Miglioramento dell'esperienza degli sviluppatori
- Aggiornamenti di Dawn
Chrome 115
- Estensioni lingua WGSL supportate
- Supporto sperimentale per Direct3D 11
- Ottenere una GPU discreta per impostazione predefinita con alimentazione CA
- Miglioramento dell'esperienza degli sviluppatori
- Aggiornamenti di Dawn
Chrome 114
- Ottimizzare JavaScript
- getCurrentTexture() su canvas non configurato genera un errore InvalidStateError
- Aggiornamenti di WGSL
- Aggiornamenti di Dawn