Testar subgrupos
O recurso de subgrupos permite o paralelismo no nível SIMD, permitindo que as linhas de execução em um grupo se comuniquem e realizem operações matemáticas coletivas (por exemplo, calcular a soma de 16 números). Isso oferece uma forma altamente eficiente de compartilhamento de dados entre linhas de execução.
Uma implementação mínima da proposta de subgrupos está disponível para testes locais com a flag "Unsafe WebGPU Support" em chrome://flags/#enable-unsafe-webgpu
.
Você também pode testar subgrupos no seu site com usuários reais inscrevendo-se no teste de origem. Leia Começar a usar testes de origem para instruções sobre como preparar seu site para usar testes de origem. O teste de origem será executado do Chrome 128 ao 131 (terminando em 19 de fevereiro de 2025). Consulte Objetivo do experimento.
Quando o recurso "subgroups"
estiver disponível em um GPUAdapter
, solicite um GPUDevice
com esse recurso para ter suporte a subgrupos em WGSL e verifique os limites de minSubgroupSize
e maxSubgroupSize
.
Você também precisa ativar explicitamente essa extensão no seu código WGSL com enable subgroups;
. Quando ativada, você tem acesso aos seguintes recursos:
subgroup_invocation_id
: um valor integrado para o índice da linha de execução no subgrupo.subgroup_size
: um valor integrado para acesso ao tamanho do subgrupo.subgroupBallot(value)
: retorna um conjunto de campos de bits em que o bit correspondente asubgroup_invocation_id
é 1 sevalue
for verdadeiro para essa invocação ativa e 0 caso contrário.subgroupBroadcast(value, id)
: transmite ovalue
da invocação comsubgroup_invocation_id
correspondente aid
para todas as invocações no subgrupo. Observação:id
precisa ser uma constante de tempo de compilação.
Mais funções integradas, como subgroupAdd
, subgroupAll
, subgroupElect
e subgroupShuffle
, serão adicionadas no futuro. Consulte o problema 354738715.
Para permitir f16 em operações de subgrupos, solicite um GPUDevice
com os recursos "subgroups"
, "subgroups-f16"
e "shader-f16"
e ative-o no seu código WGSL com enable f16, subgroups, subgroups_f16;
.
O snippet de código a seguir oferece uma base para testar e descobrir o potencial dos subgrupos.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Descontinuar a definição de bias de profundidade para linhas e pontos
Uma mudança na especificação da WebGPU faz com que seja um erro de validação definir depthBias
, depthBiasSlopeScale
e depthBiasClamp
como um valor diferente de zero quando a topologia de um pipeline de renderização é do tipo linha ou ponto. Para dar aos desenvolvedores tempo suficiente para atualizar o código, um aviso no console do DevTools é mostrado sobre essa validação futura, além de forçar os valores a 0 nessas circunstâncias. Consulte o problema 352567424.
Ocultar aviso do DevTools de erro não capturado se preventDefault
No console do DevTools, os avisos para eventos uncapturederror
não são mais exibidos se um listener de eventos para uncapturederror
foi registrado e o método preventDefault()
do evento foi chamado no callback do listener de eventos. Esse comportamento corresponde ao gerenciamento de eventos em JavaScript. Confira o exemplo a seguir e o problema 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
Primeiro, a WGSL faz a amostragem de interpolação e
O atributo interpolate
do WGSL permite gerenciar a interpolação de dados de E/S definida pelo usuário. Agora, os novos parâmetros de amostragem de interpolação first
(padrão) e either
oferecem mais controle: first
usa o valor do primeiro vértice da primitiva, enquanto either
permite o primeiro ou o último vértice. Consulte o problema 340278447.
Atualizações do amanhecer
A implementação do WGPUFuture do Dawn para processar operações assíncronas foi concluída. Os principais conceitos incluem wgpuInstanceProcessEvents para processamento oportunista de eventos e WGPUCallbackMode para definir locais de callback. WGPUFuture significa eventos únicos com um ciclo de vida infinito, e wgpuInstanceWaitAny aguarda a conclusão de qualquer futuro ou um tempo limite. Consulte o problema 42240932.
O valor CompositeAlphaMode::Auto
não é mais informado por Surface::GetCapabilities()
. Ela ainda é válida e equivalente a Surface::GetCapabilities().alphaMode[0]
. Consulte o problema 292.
O back-end do OpenGL agora oferece suporte a Surface
com uma cópia de flip Y para cada chamada de Present()
. Consulte o problema 344814083.
O método Adapter::GetProperties()
foi descontinuado em favor do uso de Adapter::GetInfo()
.
Jaswant, um colaborador externo, reescreveu todos os arquivos do CMake, facilitando a atualização e permitindo pré-builds. Confira o guia de início rápido para usar o Dawn em projetos do CMake.
Isso abrange apenas alguns dos principais destaques. Confira a lista completa de commits.
Novidades no WebGPU
Uma lista de tudo o que foi abordado na série O que há de novo no WebGPU.
Chrome 140
- Solicitações de dispositivos consomem o adaptador
- Abreviação para usar textura onde a visualização de textura é usada
- O WGSL textureSampleLevel é compatível com texturas 1D
- Descontinuar o uso de textura de armazenamento somente leitura bgra8unorm
- Remover o atributo isFallbackAdapter do GPUAdapter
- Atualizações do Dawn
Chrome 139
- Suporte a texturas 3D para formatos compactados BC e ASTC
- Novo recurso "core-features-and-limits"
- Teste de origem para o modo de compatibilidade da WebGPU
- Atualizações do Dawn
Chrome 138
- Abreviação para usar o buffer como um recurso de vinculação
- Mudanças nos requisitos de tamanho para buffers mapeados na criação
- Relatório de arquitetura para GPUs recentes
- Descontinuar o atributo isFallbackAdapter do GPUAdapter
- Atualizações do Dawn
Chrome 137
- Usar a visualização de textura para vinculação externalTexture
- Buffers são copiados sem especificar offsets e tamanho
- WGSL workgroupUniformLoad usando ponteiro para atômico
- Atributo powerPreference do GPUAdapterInfo
- Remover o atributo compatibilityMode de GPURequestAdapterOptions
- Atualizações do Dawn
Chrome 136
- Atributo isFallbackAdapter do GPUAdapterInfo
- Melhorias no tempo de compilação de sombreadores no D3D12
- Salvar e copiar imagens da tela
- Restrições do modo de compatibilidade do Lift
- Atualizações do Dawn
Chrome 135
- Permitir a criação de um layout de pipeline com um layout de grupo de vinculação nulo
- Permitir que viewports se estendam além dos limites dos destinos de renderização
- Acesso mais fácil ao modo de compatibilidade experimental no Android
- Remover o limite maxInterStageShaderComponents
- Atualizações do Dawn
Chrome 134
- Melhorar as cargas de trabalho de machine learning com subgrupos
- Remover o suporte a tipos de textura filtráveis de ponto flutuante como combináveis
- Atualizações do Dawn
Chrome 133
- Outros formatos de vértice unorm8x4-bgra e de um componente
- Permitir que limites desconhecidos sejam solicitados com valor indefinido
- Mudanças nas regras de alinhamento da WGSL
- Ganhos de performance da WGSL com descarte
- Usar displaySize do VideoFrame para texturas externas
- Processar imagens com orientações não padrão usando copyExternalImageToTexture
- Melhorar a experiência do desenvolvedor
- Ativar o modo de compatibilidade com featureLevel
- Limpeza de recursos experimentais de subgrupo
- Descontinuar o limite maxInterStageShaderComponents
- Atualizações do Dawn
Chrome 132
- Uso da visualização de textura
- Fusão de texturas de ponto flutuante de 32 bits
- Atributo adapterInfo do GPUDevice
- Configurar o contexto da tela com formato inválido gera um erro de JavaScript
- Restrições do filtro de amostragem em texturas
- Experimentos com subgrupos estendidos
- Melhorar a experiência do desenvolvedor
- Suporte experimental para formatos de textura normalizados de 16 bits
- Atualizações do Dawn
Chrome 131
- Distâncias de corte em WGSL
- GPUCanvasContext getConfiguration()
- Primitivos de ponto e linha não podem ter ajuste de profundidade
- Funções integradas de verificação inclusiva para subgrupos
- Suporte experimental para multi-draw indirect
- Opção de compilação do módulo de sombreador strict math
- Remover requestAdapterInfo() do GPUAdapter
- Atualizações do Dawn
Chrome 130
- Combinação de duas origens
- Melhorias no tempo de compilação de sombreadores no Metal
- Descontinuação do requestAdapterInfo() do GPUAdapter
- Atualizações do Dawn
Chrome 129
- Suporte a HDR com modo de mapeamento de tons da tela
- Suporte expandido para subgrupos
- Atualizações do Dawn
Chrome 128
- Testes com subgrupos
- Descontinuar a definição de bias de profundidade para linhas e pontos
- Ocultar aviso do DevTools de erro não capturado se preventDefault
- A WGSL primeiro faz a amostragem de interpolação e
- Atualizações do Dawn
Chrome 127
- Suporte experimental para OpenGL ES no Android
- Atributo de informações do GPUAdapter
- Melhorias na interoperabilidade do WebAssembly
- Melhoria nos erros do codificador de comandos
- Atualizações do Dawn
Chrome 126
- Aumentar o limite de maxTextureArrayLayers
- Otimização do upload de buffer para back-end Vulkan
- Melhorias no tempo de compilação do sombreador
- Os buffers de comando enviados precisam ser exclusivos
- Atualizações do Dawn
Chrome 125
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte a service workers e shared workers
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do Dawn
Chrome 123
- Suporte para funções integradas DP4a em WGSL
- Parâmetros de ponteiro irrestritos na WGSL
- Açúcar sintático para desreferenciar composições em WGSL
- Estado somente leitura separado para aspectos de estêncil e profundidade
- Atualizações do Dawn
Chrome 122
- Ampliar o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumentar o limite de maxVertexAttributes
- Atualizações do Dawn
Chrome 121
- Suporte à WebGPU no Android
- Usar DXC em vez de FXC para compilação de shader no Windows
- Consultas de carimbo de data/hora em transmissões de computação e renderização
- Pontos de entrada padrão para módulos de shader
- Adicionar suporte a display-p3 como espaço de cor GPUExternalTexture
- Informações de heaps de memória
- Atualizações do Dawn
Chrome 120
- Suporte a valores de ponto flutuante de 16 bits na WGSL
- Supere os limites
- Mudanças no estado de estêncil de profundidade
- Atualizações de informações do adaptador
- Quantização de consultas de carimbo de data/hora
- Recursos de faxina geral
Chrome 119
- Texturas de ponto flutuante de 32 bits filtráveis
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do Dawn
Chrome 118
- Suporte a HTMLImageElement e ImageData em
copyExternalImageToTexture()
- Suporte experimental para textura de armazenamento de leitura/gravação e somente leitura
- Atualizações do Dawn
Chrome 117
- Remover buffer de vértice
- Remover a definição do grupo de vinculação
- Silenciar erros da criação de pipeline assíncrono quando o dispositivo é perdido
- Atualizações na criação de módulos de sombreador SPIR-V
- Melhorar a experiência do desenvolvedor
- Pipelines de cache com layout gerado automaticamente
- Atualizações do Dawn
Chrome 116
- Integração do WebCodecs
- Dispositivo perdido retornado por GPUAdapter
requestDevice()
- Manter a reprodução de vídeo fluida se
importExternalTexture()
for chamado - Conformidade com as especificações
- Melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 115
- Extensões de linguagem WGSL compatíveis
- Suporte experimental para Direct3D 11
- Usar GPU discreta por padrão com alimentação CA
- Melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 114
- JavaScript do Optimize
- getCurrentTexture() em telas não configuradas gera InvalidStateError
- Atualizações da WGSL
- Atualizações do Dawn