Publicado em: 26 de fevereiro de 2025
Melhorar as cargas de trabalho de machine learning com subgrupos
Depois de um ano de desenvolvimento e testes, o recurso de subgrupos do WebGPU que permite o paralelismo no nível SIMD já está disponível. Ele permite que as linhas de execução em um grupo de trabalho se comuniquem e executem operações matemáticas coletivas, como calcular uma soma de números, e oferece um método eficiente para compartilhamento de dados entre linhas de execução. Consulte a proposta original e a entrada do chromestatus.
Para referência, o Google Meet teve aumentos de velocidade de 2,3 a 2,9 vezes ao comparar subgrupos com produtos escalares de números inteiros compactados para sombreadores de multiplicação de matriz-vetor em alguns dispositivos durante o teste de origem.
Quando o recurso "subgroups"
estiver disponível em um GPUAdapter
, solicite um GPUDevice
com esse recurso para ter suporte a subgrupos em WGSL. É útil verificar os valores de informações do adaptador subgroupMinSize
e subgroupMaxSize
, por exemplo, se você tiver um algoritmo codificado que exija um subgrupo de um determinado tamanho.
Também é necessário ativar explicitamente essa extensão no seu código WGSL com enable subgroups;
para ter acesso aos seguintes valores integrados nas etapas de sombreadores de computação e de fragmentos:
subgroup_invocation_id
: um valor integrado para o índice da linha de execução no subgrupo.subgroup_size
: um valor integrado para acesso ao tamanho do subgrupo.
As várias funções integradas de subgrupo (por exemplo, subgroupAdd()
, subgroupBallot()
, subgroupBroadcast()
, subgroupShuffle()
) permitem uma comunicação e computação eficientes entre invocações em um subgrupo. Essas operações de subgrupo são classificadas como operações de instrução única e várias linhas de execução (SIMT, na sigla em inglês). Além disso, as funções integradas de quad, que operam em um quad de invocações, facilitam a comunicação de dados dentro do quad.
É possível usar valores f16 com subgrupos ao solicitar um GPUDevice
com os recursos "shader-f16"
e "subgroups"
.
O exemplo a seguir é um bom ponto de partida para explorar subgrupos. Ele mostra um shader que usa a função integrada subgroupExclusiveMul()
para calcular fatoriais sem ler ou gravar memória para comunicar resultados intermediários.
Remover o suporte a tipos de textura filtráveis de ponto flutuante como combináveis
Agora que a fusão de texturas de ponto flutuante de 32 bits está disponível com o recurso "float32-blendable"
, o suporte incorreto para tipos de textura filtráveis de ponto flutuante como combináveis foi removido. Consulte o problema 364987733.
Atualizações do amanhecer
O Dawn agora exige o macOS 11 e o iOS 14 e só é compatível com o Metal 2.3 ou mais recente. Consulte o problema 381117827.
O novo método GetWGSLLanguageFeatures()
do wgpu::Instance
agora substitui EnumerateWGSLLanguageFeatures()
. Consulte o problema 368672124.
Os tipos de vinculação a seguir têm um valor Undefined
, e os valores padrão no layout de vinculação foram alterados. Consulte o problema 377820810.
wgpu::BufferBindingType::Undefined
agora éUniform
wgpu::SamplerBindingType::Undefined
agora éFiltering
wgpu::TextureSampleType::Undefined
agora éFloat
- O
wgpu::StorageTextureAccess::Undefined
agora éWriteOnly
Isso abrange apenas alguns dos principais destaques. Confira a lista completa de commits.
Novidades no WebGPU
Uma lista de tudo o que foi abordado na série O que há de novo no WebGPU.
Chrome 140
- Solicitações de dispositivos consomem o adaptador
- Abreviação para usar textura onde a visualização de textura é usada
- O WGSL textureSampleLevel é compatível com texturas 1D
- Descontinuar o uso de textura de armazenamento somente leitura bgra8unorm
- Remover o atributo isFallbackAdapter do GPUAdapter
- Atualizações do Dawn
Chrome 139
- Suporte a texturas 3D para formatos compactados BC e ASTC
- Novo recurso "core-features-and-limits"
- Teste de origem para o modo de compatibilidade da WebGPU
- Atualizações do Dawn
Chrome 138
- Abreviação para usar o buffer como um recurso de vinculação
- Mudanças nos requisitos de tamanho para buffers mapeados na criação
- Relatório de arquitetura para GPUs recentes
- Descontinuar o atributo isFallbackAdapter do GPUAdapter
- Atualizações do Dawn
Chrome 137
- Usar a visualização de textura para vinculação externalTexture
- Buffers são copiados sem especificar offsets e tamanho
- WGSL workgroupUniformLoad usando ponteiro para atômico
- Atributo powerPreference do GPUAdapterInfo
- Remover o atributo compatibilityMode de GPURequestAdapterOptions
- Atualizações do Dawn
Chrome 136
- Atributo isFallbackAdapter do GPUAdapterInfo
- Melhorias no tempo de compilação de sombreadores no D3D12
- Salvar e copiar imagens da tela
- Restrições do modo de compatibilidade do Lift
- Atualizações do Dawn
Chrome 135
- Permitir a criação de um layout de pipeline com um layout de grupo de vinculação nulo
- Permitir que viewports se estendam além dos limites dos destinos de renderização
- Acesso mais fácil ao modo de compatibilidade experimental no Android
- Remover o limite maxInterStageShaderComponents
- Atualizações do Dawn
Chrome 134
- Melhorar as cargas de trabalho de machine learning com subgrupos
- Remover o suporte a tipos de textura filtráveis de ponto flutuante como combináveis
- Atualizações do Dawn
Chrome 133
- Outros formatos de vértice unorm8x4-bgra e de um componente
- Permitir que limites desconhecidos sejam solicitados com valor indefinido
- Mudanças nas regras de alinhamento da WGSL
- Ganhos de performance da WGSL com descarte
- Usar displaySize do VideoFrame para texturas externas
- Processar imagens com orientações não padrão usando copyExternalImageToTexture
- Melhorar a experiência do desenvolvedor
- Ativar o modo de compatibilidade com featureLevel
- Limpeza de recursos experimentais de subgrupo
- Descontinuar o limite maxInterStageShaderComponents
- Atualizações do Dawn
Chrome 132
- Uso da visualização de textura
- Fusão de texturas de ponto flutuante de 32 bits
- Atributo adapterInfo do GPUDevice
- Configurar o contexto da tela com formato inválido gera um erro de JavaScript
- Restrições do filtro de amostragem em texturas
- Experimentos com subgrupos estendidos
- Melhorar a experiência do desenvolvedor
- Suporte experimental para formatos de textura normalizados de 16 bits
- Atualizações do Dawn
Chrome 131
- Distâncias de corte em WGSL
- GPUCanvasContext getConfiguration()
- Primitivos de ponto e linha não podem ter ajuste de profundidade
- Funções integradas de verificação inclusiva para subgrupos
- Suporte experimental para multi-draw indirect
- Opção de compilação do módulo de sombreador strict math
- Remover requestAdapterInfo() do GPUAdapter
- Atualizações do Dawn
Chrome 130
- Combinação de duas origens
- Melhorias no tempo de compilação de sombreadores no Metal
- Descontinuação do requestAdapterInfo() do GPUAdapter
- Atualizações do Dawn
Chrome 129
- Suporte a HDR com modo de mapeamento de tons da tela
- Suporte expandido para subgrupos
- Atualizações do Dawn
Chrome 128
- Testes com subgrupos
- Descontinuar a definição de bias de profundidade para linhas e pontos
- Ocultar aviso do DevTools de erro não capturado se preventDefault
- A WGSL primeiro faz a amostragem de interpolação e
- Atualizações do Dawn
Chrome 127
- Suporte experimental para OpenGL ES no Android
- Atributo de informações do GPUAdapter
- Melhorias na interoperabilidade do WebAssembly
- Melhoria nos erros do codificador de comandos
- Atualizações do Dawn
Chrome 126
- Aumentar o limite de maxTextureArrayLayers
- Otimização do upload de buffer para back-end Vulkan
- Melhorias no tempo de compilação do sombreador
- Os buffers de comando enviados precisam ser exclusivos
- Atualizações do Dawn
Chrome 125
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte a service workers e shared workers
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do Dawn
Chrome 123
- Suporte para funções integradas DP4a em WGSL
- Parâmetros de ponteiro irrestritos na WGSL
- Açúcar sintático para desreferenciar composições em WGSL
- Estado somente leitura separado para aspectos de estêncil e profundidade
- Atualizações do Dawn
Chrome 122
- Ampliar o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumentar o limite de maxVertexAttributes
- Atualizações do Dawn
Chrome 121
- Suporte à WebGPU no Android
- Usar DXC em vez de FXC para compilação de shader no Windows
- Consultas de carimbo de data/hora em transmissões de computação e renderização
- Pontos de entrada padrão para módulos de shader
- Adicionar suporte a display-p3 como espaço de cor GPUExternalTexture
- Informações de heaps de memória
- Atualizações do Dawn
Chrome 120
- Suporte a valores de ponto flutuante de 16 bits na WGSL
- Supere os limites
- Mudanças no estado de estêncil de profundidade
- Atualizações de informações do adaptador
- Quantização de consultas de carimbo de data/hora
- Recursos de faxina geral
Chrome 119
- Texturas de ponto flutuante de 32 bits filtráveis
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do Dawn
Chrome 118
- Suporte a HTMLImageElement e ImageData em
copyExternalImageToTexture()
- Suporte experimental para textura de armazenamento de leitura/gravação e somente leitura
- Atualizações do Dawn
Chrome 117
- Remover buffer de vértice
- Remover a definição do grupo de vinculação
- Silenciar erros da criação de pipeline assíncrono quando o dispositivo é perdido
- Atualizações na criação de módulos de sombreador SPIR-V
- Melhorar a experiência do desenvolvedor
- Pipelines de cache com layout gerado automaticamente
- Atualizações do Dawn
Chrome 116
- Integração do WebCodecs
- Dispositivo perdido retornado por GPUAdapter
requestDevice()
- Manter a reprodução de vídeo fluida se
importExternalTexture()
for chamado - Conformidade com as especificações
- Melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 115
- Extensões de linguagem WGSL compatíveis
- Suporte experimental para Direct3D 11
- Usar GPU discreta por padrão com alimentação CA
- Melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 114
- JavaScript do Optimize
- getCurrentTexture() em telas não configuradas gera InvalidStateError
- Atualizações da WGSL
- Atualizações do Dawn