Supporto delle funzioni integrate DP4a in WGSL
DP4a (Dot Product of 4 Elements and Accumulate) si riferisce a un insieme di istruzioni GPU di uso comune nell'inferenza di deep learning per la quantizzazione. Esegue in modo efficiente i prodotti scalari interi a 8 bit per accelerare il calcolo di questi modelli quantizzati int8. Può risparmiare (fino al 75%) memoria e larghezza di banda di rete e migliorare il rendimento di qualsiasi modello di machine learning nell'inferenza rispetto alla versione f32. Di conseguenza, ora viene utilizzato molto in molti framework di AI popolari.
Quando l'estensione del linguaggio "packed_4x8_integer_dot_product" WGSL è presente in navigator.gpu.wgslLanguageFeatures, ora puoi utilizzare scalari interi a 32 bit che contengono vettori a 4 componenti di numeri interi a 8 bit come input per le istruzioni del prodotto scalare nel codice shader WGSL con le funzioni integrate dot4U8Packed e dot4I8Packed. Puoi anche utilizzare le istruzioni di packing e unpacking con vettori a 4 componenti di numeri interi a 8 bit con le funzioni integrate WGSL pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 e unpack4xU8.
Ti consigliamo di utilizzare una direttiva requires per segnalare la potenziale non portabilità con requires packed_4x8_integer_dot_product; nella parte superiore del codice dello shader WGSL. Vedi l'esempio seguente e il problema tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Un ringraziamento speciale al team Web Graphics di Intel a Shanghai per aver portato a termine questa specifica e la sua implementazione.
Parametri del puntatore senza limitazioni in WGSL
L'"unrestricted_pointer_parameters"estensione del linguaggio WGSL allenta le restrizioni sui puntatori che possono essere passati alle funzioni WGSL:
Puntatori ai parametri degli spazi di indirizzi
storage,uniformeworkgroupalle funzioni dichiarate dall'utente.Passaggio di puntatori a membri di strutture ed elementi di array a funzioni dichiarate dall'utente.
Per saperne di più, consulta Pointers As Function Parameters | Tour of WGSL.
Questa funzionalità può essere rilevata utilizzando navigator.gpu.wgslLanguageFeatures. Ti consigliamo di utilizzare sempre una direttiva requires per segnalare la potenziale non portabilità con requires unrestricted_pointer_parameters; nella parte superiore del codice dello shader WGSL. Consulta l'esempio seguente, le modifiche alle specifiche WGSL e il problema tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Zucchero sintattico per la dereferenziazione dei compositi in WGSL
Quando l'estensione del linguaggio "pointer_composite_access"WGSL è presente in navigator.gpu.wgslLanguageFeatures, il codice shader WGSL ora supporta l'accesso ai componenti di tipi di dati complessi utilizzando la stessa sintassi con il punto (.), sia che tu stia lavorando direttamente con i dati sia con un puntatore. Ecco come funziona:
Se
fooè un puntatore:foo.barè un modo più pratico per scrivere(*foo).bar. L'asterisco (*) normalmente è necessario per trasformare il puntatore in un "riferimento" che può essere dereferenzato, ma ora i puntatori e i riferimenti sono molto più simili e quasi intercambiabili.Se
foonon è un puntatore: l'operatore punto (.) funziona esattamente come di consueto per accedere direttamente ai membri.
Allo stesso modo, se pa è un puntatore che memorizza l'indirizzo iniziale di un array, l'utilizzo di pa[i] consente di accedere direttamente alla posizione di memoria in cui è memorizzato l''i° elemento di quell'array.
Ti consigliamo di utilizzare una direttiva requires per segnalare la potenziale non portabilità con requires pointer_composite_access; nella parte superiore del codice dello shader WGSL. Vedi l'esempio seguente e il problema tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Stato di sola lettura separato per gli aspetti stencil e profondità
In precedenza, gli allegati di stencil di profondità di sola lettura nei passaggi di rendering richiedevano che entrambi gli aspetti (profondità e stencil) fossero di sola lettura. Questa limitazione è stata rimossa. Ora puoi utilizzare l'aspetto della profondità in modalità di sola lettura, ad esempio per il tracciamento dell'ombra di contatto, mentre il buffer dello stencil viene scritto per identificare i pixel per l'ulteriore elaborazione. Vedi issue dawn:2146.
Aggiornamenti all'alba
La callback di errore non acquisito impostata con wgpuDeviceSetUncapturedErrorCallback() viene ora chiamata immediatamente quando si verifica l'errore. Questo è ciò che gli sviluppatori si aspettano e desiderano costantemente per il debug. Vedi change dawn:173620.
È stato implementato il metodo wgpuSurfaceGetPreferredFormat() dell'API webgpu.h. Vedi problema dawn:1362.
Questi sono solo alcuni dei punti salienti. Consulta l'elenco completo dei commit.
Novità di WebGPU
Un elenco di tutti gli argomenti trattati nella serie Novità di WebGPU.
Chrome 149-150
Chrome 147-148
Chrome 146
- Supportare la modalità di compatibilità WebGPU su OpenGL ES 3.1
- Allegati temporanei
- Estensione WGSL texture_and_sampler_let
- Aggiornamenti di Dawn
Chrome 145
- Estensione subgroup_uniformity WGSL
- Mappatura sincrona sperimentale dei buffer nei worker
- Aggiornamenti di Dawn
Chrome 144
- Estensione subgroup_id WGSL
- Estensione uniform_buffer_standard_layout di WGSL
- WebGPU su Linux
- writeBuffer e writeTexture più veloci
- Aggiornamenti di Dawn
Chrome 143
- Scambio di componenti di texture
- Rimuovere l'utilizzo della texture di archiviazione di sola lettura bgra8unorm
- Aggiornamenti di Dawn
Chrome 142
- Funzionalità di supporto del formato delle texture estese
- Indice primitivo in WGSL
- Aggiornamenti di Dawn
Chrome 141
- Tint IR completed
- Analisi dell'intervallo di numeri interi nel compilatore WGSL
- Aggiornamento di SPIR-V 1.4 per il backend Vulkan
- Aggiornamenti di Dawn
Chrome 140
- Le richieste di dispositivi utilizzano l'adattatore
- Abbreviazione per l'utilizzo della texture in cui viene utilizzata la visualizzazione della texture
- textureSampleLevel di WGSL supporta le texture 1D
- Ritiro dell'utilizzo della texture di archiviazione di sola lettura bgra8unorm
- Rimuovi l'attributo isFallbackAdapter di GPUAdapter
- Aggiornamenti di Dawn
Chrome 139
- Supporto delle texture 3D per i formati compressi BC e ASTC
- Nuova funzionalità "Funzionalità e limiti principali"
- Prova dell'origine per la modalità di compatibilità WebGPU
- Aggiornamenti di Dawn
Chrome 138
- Abbreviazione per l'utilizzo del buffer come risorsa di binding
- Modifiche ai requisiti di dimensione per i buffer mappati durante la creazione
- Report sull'architettura per le GPU recenti
- Deprecare l'attributo isFallbackAdapter di GPUAdapter
- Aggiornamenti di Dawn
Chrome 137
- Utilizzare la visualizzazione della texture per il binding externalTexture
- I buffer vengono copiati senza specificare offset e dimensioni
- WGSL workgroupUniformLoad utilizzando il puntatore ad atomic
- Attributo powerPreference di GPUAdapterInfo
- Rimuovi l'attributo compatibilityMode di GPURequestAdapterOptions
- Aggiornamenti di Dawn
Chrome 136
- Attributo isFallbackAdapter di GPUAdapterInfo
- Miglioramenti del tempo di compilazione degli shader su D3D12
- Salvare e copiare le immagini della tela
- Limitazioni della modalità di compatibilità dell'impatto
- Aggiornamenti di Dawn
Chrome 135
- Consenti la creazione del layout della pipeline con il layout del gruppo di binding nullo
- Consenti alle finestre di estendersi oltre i limiti delle destinazioni di rendering
- Accesso più semplice alla modalità di compatibilità sperimentale su Android
- Rimuovere il limite maxInterStageShaderComponents
- Aggiornamenti di Dawn
Chrome 134
- Migliorare i carichi di lavoro di machine learning con i sottogruppi
- Rimuovere il supporto dei tipi di texture filtrabili float come miscelabili
- Aggiornamenti di Dawn
Chrome 133
- Formati dei vertici unorm8x4-bgra e a un componente aggiuntivi
- Consenti di richiedere limiti sconosciuti con valore indefinito
- Modifiche alle regole di allineamento WGSL
- Miglioramenti delle prestazioni di WGSL con l'eliminazione
- Utilizzare displaySize di VideoFrame per le texture esterne
- Gestire le immagini con orientamenti non predefiniti utilizzando copyExternalImageToTexture
- Migliorare l'esperienza degli sviluppatori
- Attivare la modalità di compatibilità con featureLevel
- Pulizia delle funzionalità dei sottogruppi sperimentali
- Ritiro del limite maxInterStageShaderComponents
- Aggiornamenti di Dawn
Chrome 132
- Utilizzo della visualizzazione texture
- Fusione di texture in virgola mobile a 32 bit
- Attributo adapterInfo di GPUDevice
- Configurazione del contesto del canvas con formato non valido che genera un errore JavaScript
- Limitazioni del campionamento dei filtri sulle texture
- Sperimentazione estesa dei sottogruppi
- Migliorare l'esperienza degli sviluppatori
- Supporto sperimentale per i formati di texture normalizzati a 16 bit
- Aggiornamenti di Dawn
Chrome 131
- Distanze di ritaglio in WGSL
- GPUCanvasContext getConfiguration()
- Le primitive punto e linea non devono avere distorsione della profondità
- Funzioni integrate di scansione inclusiva per i sottogruppi
- Supporto sperimentale per l'estrazione indiretta multipla
- Opzione di compilazione del modulo shader strict math
- Rimozione di requestAdapterInfo() di GPUAdapter
- Aggiornamenti di Dawn
Chrome 130
- Combinazione di due fonti
- Miglioramenti al tempo di compilazione degli shader su Metal
- Ritiro di GPUAdapter requestAdapterInfo()
- Aggiornamenti di Dawn
Chrome 129
- Supporto HDR con modalità di mappatura della tonalità della tela
- Supporto dei sottogruppi esteso
- Aggiornamenti di Dawn
Chrome 128
- Sperimentare con i sottogruppi
- Ritiro dell'impostazione della distorsione della profondità per linee e punti
- Nascondi l'avviso di errore non acquisito di DevTools se preventDefault
- WGSL interpolate sampling first and either
- Aggiornamenti di Dawn
Chrome 127
- Supporto sperimentale per OpenGL ES su Android
- Attributo info di GPUAdapter
- Miglioramenti dell'interoperabilità di WebAssembly
- Errori di codifica dei comandi migliorati
- Aggiornamenti di Dawn
Chrome 126
- Aumentare il limite maxTextureArrayLayers
- Ottimizzazione del caricamento del buffer per il backend Vulkan
- Miglioramenti al tempo di compilazione degli shader
- I buffer dei comandi inviati devono essere univoci
- Aggiornamenti di Dawn
Chrome 125
- Sottogruppi (funzionalità in fase di sviluppo)
- Rendering in una sezione della texture 3D
- Aggiornamenti di Dawn
Chrome 124
- Texture di archiviazione di sola lettura e lettura/scrittura
- Supporto di service worker e shared worker
- Nuovi attributi delle informazioni sull'adattatore
- Correzioni di bug
- Aggiornamenti di Dawn
Chrome 123
- Supporto delle funzioni integrate DP4a in WGSL
- Parametri del puntatore senza limitazioni in WGSL
- Zucchero sintattico per la dereferenziazione dei compositi in WGSL
- Stato di sola lettura separato per gli aspetti stencil e profondità
- Aggiornamenti di Dawn
Chrome 122
- Ampliare la copertura con la modalità di compatibilità (funzionalità in fase di sviluppo)
- Aumentare il limite maxVertexAttributes
- Aggiornamenti di Dawn
Chrome 121
- Supporto di WebGPU su Android
- Utilizzare DXC anziché FXC per la compilazione degli shader su Windows
- Query sui timestamp nei passaggi di calcolo e rendering
- Punti di ingresso predefiniti per i moduli shader
- Supporto di display-p3 come spazio colore GPUExternalTexture
- Informazioni sugli heap di memoria
- Aggiornamenti di Dawn
Chrome 120
- Supporto per valori a rappresentazione in virgola mobile a 16 bit in WGSL
- Superare i limiti
- Modifiche allo stato di profondità-stencil
- Aggiornamenti delle informazioni sull'adattatore
- Quantizzazione delle query con timestamp
- Funzionalità per le pulizie di primavera
Chrome 119
- Texture a virgola mobile a 32 bit filtrabili
- Formato vertice unorm10-10-10-2
- Formato della texture rgb10a2uint
- Aggiornamenti di Dawn
Chrome 118
- Supporto di HTMLImageElement e ImageData in
copyExternalImageToTexture() - Supporto sperimentale per la texture di archiviazione in lettura/scrittura e sola lettura
- Aggiornamenti di Dawn
Chrome 117
- Annulla impostazione del buffer dei vertici
- Annulla impostazione gruppo di binding
- Silenzia gli errori durante la creazione della pipeline asincrona quando il dispositivo viene smarrito
- Aggiornamenti alla creazione di moduli shader SPIR-V
- Migliorare l'esperienza degli sviluppatori
- Pipeline di memorizzazione nella cache con layout generato automaticamente
- Aggiornamenti di Dawn
Chrome 116
- Integrazione di WebCodecs
- Dispositivo smarrito restituito da GPUAdapter
requestDevice() - Mantenere la riproduzione video fluida se viene chiamato
importExternalTexture() - Conformità alle specifiche
- Migliorare l'esperienza degli sviluppatori
- Aggiornamenti di Dawn
Chrome 115
- Estensioni del linguaggio WGSL supportate
- Supporto sperimentale per Direct3D 11
- Utilizzare la GPU discreta per impostazione predefinita quando il dispositivo è collegato all'alimentazione CA
- Migliorare l'esperienza degli sviluppatori
- Aggiornamenti di Dawn
Chrome 114
- Ottimizzare JavaScript
- getCurrentTexture() su canvas non configurato genera InvalidStateError
- Aggiornamenti di WGSL
- Aggiornamenti di Dawn