Suporte a funções integradas do DP4a na WGSL
DP4a (Dot Product of 4 Elements and Accumulate) se refere a um conjunto de instruções de GPU usadas com frequência na inferência de aprendizado profundo para quantização. Ele realiza produtos escalares de números inteiros de 8 bits de maneira eficiente para acelerar a computação desses modelos quantizados de int8. Ele pode economizar (até 75%) da memória e da largura de banda da rede e melhorar o desempenho de qualquer modelo de machine learning na inferência em comparação com a versão f32. Como resultado, agora ele é muito usado em muitas estruturas de IA populares.
Quando a extensão de linguagem WGSL "packed_4x8_integer_dot_product" está presente em navigator.gpu.wgslLanguageFeatures, agora é possível usar escalares de números inteiros de 32 bits que empacotam vetores de 4 componentes de números inteiros de 8 bits como entradas para as instruções de produto escalar no código do sombreador WGSL com as funções integradas dot4U8Packed e dot4I8Packed. Também é possível usar instruções de empacotamento e desempacotamento com vetores de 4 componentes de números inteiros de 8 bits com as funções integradas pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 e unpack4xU8 da WGSL.
Recomendamos usar uma diretiva requires para sinalizar a possibilidade de não portabilidade com requires packed_4x8_integer_dot_product; na parte de cima do código do sombreador WGSL. Consulte o exemplo a seguir e o problema tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Agradecemos à equipe de gráficos da Web da Intel em Xangai por impulsionar essa especificação e implementação até a conclusão.
Parâmetros de ponteiro irrestritos na WGSL
A "unrestricted_pointer_parameters" extensão de linguagem WGSL flexibiliza as restrições sobre quais ponteiros podem ser transmitidos para funções WGSL:
Ponteiros de parâmetros de espaços de endereço
storage,uniformeworkgrouppara funções declaradas pelo usuário.Transmissão de ponteiros para membros de estrutura e elementos de matriz para funções declaradas pelo usuário.
Confira Ponteiros como parâmetros de função | Tour of WGSL para saber mais.
Esse recurso pode ser detectado usando navigator.gpu.wgslLanguageFeatures. Recomendamos sempre usar uma diretiva requires para sinalizar a possibilidade de não portabilidade com requires unrestricted_pointer_parameters; na parte de cima do código do shader WGSL. Consulte o exemplo a seguir, as mudanças na especificação da WGSL e o problema tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Açúcar sintático para desreferenciar composições na WGSL
Quando a extensão de linguagem WGSL "pointer_composite_access" está presente em navigator.gpu.wgslLanguageFeatures, o código do sombreador WGSL agora oferece suporte ao acesso a componentes de tipos de dados complexos usando a mesma sintaxe de ponto (.), seja trabalhando diretamente com os dados ou com um ponteiro para eles. Veja como funciona:
Se
foofor um ponteiro:foo.baré uma maneira mais conveniente de escrever(*foo).bar. O asterisco (*) normalmente seria necessário para transformar o ponteiro em uma "referência" que pode ser desreferenciada, mas agora os ponteiros e as referências são muito mais semelhantes e quase intercambiáveis.Se
foonão for um ponteiro: o operador de ponto (.) funciona exatamente como você está acostumado para acessar membros diretamente.
Da mesma forma, se pa for um ponteiro que armazena o endereço inicial de uma matriz, o uso de pa[i] oferece acesso direto ao local da memória em que o 'i'th elemento dessa matriz está armazenado.
Recomendamos usar uma diretiva requires para sinalizar a possibilidade de não portabilidade com requires pointer_composite_access; na parte de cima do código do sombreador WGSL. Consulte o exemplo a seguir e o problema tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Estado somente leitura separado para aspectos de estêncil e profundidade
Anteriormente, os anexos de estêncil de profundidade somente leitura em passagens de renderização exigiam que ambos os aspectos (profundidade e estêncil) fossem somente leitura. Essa limitação foi removida. Agora, é possível usar o aspecto de profundidade no modo somente leitura, por exemplo, para rastreamento de sombra de contato, enquanto o buffer de estêncil é gravado para identificar pixels para processamento adicional. Consulte o problema dawn:2146.
Atualizações do Dawn
O callback de erro não capturado definido com wgpuDeviceSetUncapturedErrorCallback() agora é chamado imediatamente quando o erro acontece. É isso que os desenvolvedores esperam e querem para depuração. Consulte a mudança dawn:173620.
O método wgpuSurfaceGetPreferredFormat() da API webgpu.h foi implementado. Consulte o problema dawn:1362.
Isso abrange apenas alguns dos principais destaques. Confira a lista exaustiva de commits.
Novidades na WebGPU
Uma lista de tudo o que foi abordado na série Novidades na WebGPU.
Chrome 147-148
Chrome 146
- Suporte ao modo de compatibilidade da WebGPU no OpenGL ES 3.1
- Anexos temporários
- Extensão texture_and_sampler_let da WGSL
- Atualizações do Dawn
Chrome 145
- Extensão subgroup_uniformity da WGSL
- Mapeamento de buffer síncrono experimental em workers
- Atualizações do Dawn
Chrome 144
- Extensão subgroup_id da WGSL
- Extensão uniform_buffer_standard_layout da WGSL
- WebGPU no Linux
- writeBuffer e writeTexture mais rápidos
- Atualizações do Dawn
Chrome 143
- Swizzle de componente de textura
- Remover o uso de textura de armazenamento somente leitura bgra8unorm
- Atualizações do Dawn
Chrome 142
- Capacidades de suporte a formatos de textura estendidas
- Índice primitivo na WGSL
- Atualizações do Dawn
Chrome 141
- Tint IR concluído
- Análise de intervalo de números inteiros no compilador WGSL
- Atualização do SPIR-V 1.4 para o back-end do Vulkan
- Atualizações do Dawn
Chrome 140
- As solicitações de dispositivos consomem o adaptador
- Atalho para usar a textura em que a visualização de textura é usada
- A WGSL textureSampleLevel oferece suporte a texturas 1D
- Descontinuar o uso de textura de armazenamento somente leitura bgra8unorm
- Remover o atributo isFallbackAdapter do GPUAdapter
- Atualizações do Dawn
Chrome 139
- Suporte a texturas 3D para formatos compactados BC e ASTC
- Novo recurso "core-features-and-limits"
- Teste de origem para o modo de compatibilidade da WebGPU
- Atualizações do Dawn
Chrome 138
- Atalho para usar o buffer como um recurso de vinculação
- Mudanças nos requisitos de tamanho para buffers mapeados na criação
- Relatório de arquitetura para GPUs recentes
- Descontinuar o atributo isFallbackAdapter do GPUAdapter
- Atualizações do Dawn
Chrome 137
- Usar a visualização de textura para vinculação externalTexture
- Buffers copiados sem especificar deslocamentos e tamanho
- WGSL workgroupUniformLoad usando ponteiro para atômico
- Atributo powerPreference do GPUAdapterInfo
- Remover o atributo compatibilityMode do GPURequestAdapterOptions
- Atualizações do Dawn
Chrome 136
- Atributo isFallbackAdapter do GPUAdapterInfo
- Melhorias no tempo de compilação do sombreador no D3D12
- Salvar e copiar imagens de tela
- Remover restrições do modo de compatibilidade
- Atualizações do Dawn
Chrome 135
- Permitir a criação de layout de pipeline com layout de grupo de vinculação nulo
- Permitir que as janelas de visualização se estendam além dos limites dos destinos de renderização
- Acesso mais fácil ao modo de compatibilidade experimental no Android
- Remover o limite maxInterStageShaderComponents
- Atualizações do Dawn
Chrome 134
- Melhorar as cargas de trabalho de machine learning com subgrupos
- Remover o suporte a tipos de textura filtráveis de ponto flutuante como mescláveis
- Atualizações do Dawn
Chrome 133
- Formatos de vértice unorm8x4-bgra e de 1 componente adicionais
- Permitir que limites desconhecidos sejam solicitados com valor indefinido
- Mudanças nas regras de alinhamento da WGSL
- Ganhos de desempenho da WGSL com descarte
- Usar displaySize do VideoFrame para texturas externas
- Processar imagens com orientações não padrão usando copyExternalImageToTexture
- Melhorar a experiência do desenvolvedor
- Ativar o modo de compatibilidade com featureLevel
- Limpeza de recursos experimentais de subgrupo
- Descontinuar o limite maxInterStageShaderComponents
- Atualizações do Dawn
Chrome 132
- Uso da visualização de textura
- Mesclagem de texturas de ponto flutuante de 32 bits
- Atributo adapterInfo do GPUDevice
- Configurar o contexto da tela com formato inválido gera erro de JavaScript
- Restrições de amostrador de filtragem em texturas
- Experimentação estendida de subgrupos
- Melhorar a experiência do desenvolvedor
- Suporte experimental para formatos de textura normalizados de 16 bits
- Atualizações do Dawn
Chrome 131
- Distâncias de recorte na WGSL
- GPUCanvasContext getConfiguration()
- Primitivos de ponto e linha não podem ter viés de profundidade
- Funções integradas de verificação inclusiva para subgrupos
- Suporte experimental para multi-draw indireto
- Opção de compilação do módulo de sombreador matemática estrita
- Remover GPUAdapter requestAdapterInfo()
- Atualizações do Dawn
Chrome 130
- Mesclagem de origem dupla
- Melhorias no tempo de compilação do sombreador no Metal
- Descontinuação de GPUAdapter requestAdapterInfo()
- Atualizações do Dawn
Chrome 129
- Suporte a HDR com modo de mapeamento de tons de tela
- Suporte expandido a subgrupos
- Atualizações do Dawn
Chrome 128
- Experimentando com subgrupos
- Descontinuar a configuração de viés de profundidade para linhas e pontos
- Ocultar o aviso de erro não capturado do DevTools se preventDefault
- WGSL interpola a amostragem primeiro e depois
- Atualizações do Dawn
Chrome 127
- Suporte experimental para OpenGL ES no Android
- Atributo de informações do GPUAdapter
- Melhorias na interoperabilidade do WebAssembly
- Erros de codificador de comando aprimorados
- Atualizações do Dawn
Chrome 126
- Aumentar o limite maxTextureArrayLayers
- Otimização do upload de buffer para o back-end do Vulkan
- Melhorias no tempo de compilação do sombreador
- Os buffers de comando enviados precisam ser exclusivos
- Atualizações do Dawn
Chrome 125
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte a service workers e shared workers
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do Dawn
Chrome 123
- Suporte a funções integradas do DP4a na WGSL
- Parâmetros de ponteiro irrestritos na WGSL
- Açúcar sintático para desreferenciar composições na WGSL
- Estado somente leitura separado para aspectos de estêncil e profundidade
- Atualizações do Dawn
Chrome 122
- Ampliar o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumentar o limite maxVertexAttributes
- Atualizações do Dawn
Chrome 121
- Suporte à WebGPU no Android
- Usar o DXC em vez do FXC para compilação de sombreador no Windows
- Consultas de carimbo de data/hora em passagens de computação e renderização
- Pontos de entrada padrão para módulos de sombreador
- Suporte a display-p3 como espaço de cor GPUExternalTexture
- Informações sobre heaps de memória
- Atualizações do Dawn
Chrome 120
- Suporte a valores de ponto flutuante de 16 bits na WGSL
- Ultrapassar os limites
- Mudanças no estado de estêncil de profundidade
- Atualizações de informações do adaptador
- Quantização de consultas de carimbo de data/hora
- Recursos de limpeza de primavera
Chrome 119
- Texturas de ponto flutuante de 32 bits filtráveis
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do Dawn
Chrome 118
- Suporte a HTMLImageElement e ImageData em
copyExternalImageToTexture() - Suporte experimental para textura de armazenamento de leitura/gravação e somente leitura
- Atualizações do Dawn
Chrome 117
- Buffer de vértice não definido
- Grupo de vinculação não definido
- Erros de silêncio da criação de pipeline assíncrono quando o dispositivo é perdido
- Atualizações de criação de módulo de sombreador SPIR-V
- Melhorar a experiência do desenvolvedor
- Pipelines de armazenamento em cache com layout gerado automaticamente
- Atualizações do Dawn
Chrome 116
- Integração do WebCodecs
- Dispositivo perdido retornado por GPUAdapter
requestDevice() - Manter a reprodução de vídeo suave se
importExternalTexture()for chamado - Conformidade com a especificação
- Melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 115
- Extensões de linguagem WGSL com suporte
- Suporte experimental para Direct3D 11
- Receber GPU discreta por padrão na alimentação CA
- Melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 114
- Otimizar o JavaScript
- getCurrentTexture() em uma tela não configurada gera InvalidStateError
- Atualizações da WGSL
- Atualizações do Dawn