Suporte a valores de ponto flutuante de 16 bits no WGSL
No WGSL, o tipo f16
é o conjunto de valores de ponto flutuante de 16 bits do formato IEEE-754 binary16 (meia precisão). Isso significa que ele usa 16 bits para representar um número de ponto flutuante, em vez de 32 bits para ponto flutuante de precisão única convencional (f32
). Esse tamanho menor pode levar a melhorias significativas no desempenho, especialmente ao processar grandes quantidades de dados.
Para comparação, em um dispositivo Apple M1 Pro, a implementação f16
dos modelos Llama2 7B usados na demonstração de chat do WebLLM é significativamente mais rápida do que a implementação f32
, com uma melhoria de 28% na velocidade de preenchimento automático e 41% na velocidade de decodificação, conforme mostrado nas capturas de tela a seguir.
Nem todas as GPUs são compatíveis com valores de ponto flutuante de 16 bits. Quando o recurso "shader-f16"
estiver disponível em um GPUAdapter
, será possível solicitar um GPUDevice
com esse recurso e criar um módulo de sombreador WGSL que aproveite o tipo de ponto flutuante de meia precisão f16
. Esse tipo só é válido para uso no módulo de sombreador WGSL se você ativar a extensão WGSL f16
com enable f16;
. Caso contrário, createShaderModule() vai gerar um erro de validação. Confira o exemplo mínimo a seguir e o problema dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
É possível oferecer suporte aos tipos f16
e f32
no código do módulo de sombreador do WGSL com um alias
, dependendo do suporte ao recurso "shader-f16"
, conforme mostrado no snippet a seguir.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Supere os limites
Por padrão, o número máximo de bytes necessários para armazenar uma amostra (pixel ou subpixel) de dados de saída do pipeline de renderização em todos os anexos coloridos é de 32 bytes. Agora é possível solicitar até 64 usando o limite de maxColorAttachmentBytesPerSample
. Confira o exemplo a seguir e issue dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Os limites de maxInterStageShaderVariables
e maxInterStageShaderComponents
usados para a comunicação entre estágios foram aumentados em todas as plataformas. Consulte o problema dawn:1448 (link em inglês) para saber mais.
Para cada estágio do sombreador, o número máximo de entradas de layout de grupo de vinculação em um layout de pipeline que são buffers de armazenamento é 8 por padrão. Agora é possível solicitar até 10 usando o limite de maxStorageBuffersPerShaderStage
. Consulte o problema dawn:2159.
Um novo limite de maxBindGroupsPlusVertexBuffers
foi adicionado. Ele consiste no número máximo de slots de grupo de vinculação e de buffer de vértice usados simultaneamente, contando os slots vazios abaixo do índice mais alto. O valor padrão é 24. Consulte o problema dawn:1849 (link em inglês).
Mudanças no estado do depth-stencil
Para melhorar a experiência do desenvolvedor, os atributos de estado de profundidade do stencil depthWriteEnabled
e depthCompare
não são mais obrigatórios: depthWriteEnabled
é necessário apenas para formatos com profundidade, e depthCompare
não é necessário para formatos com profundidade se não for usado. Consulte issue dawn:2132.
Atualizações de informações do adaptador
Os atributos de informações de adaptador type
e backend
não padrão agora estão disponíveis ao chamar requestAdapterInfo() quando o usuário ativa a flag "WebGPU Developer Features" em chrome://flags/#enable-webgpu-developer-features
. O type
pode ser "GPU discreta", "GPU integrada", "CPU" ou "desconhecido". O backend
é "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" ou "null". Consulte issue dawn:2112 e issue dawn:2107.
O parâmetro de lista unmaskHints
opcional em requestAdapterInfo() foi removido. Consulte o problema dawn:1427.
Quantização de consultas de carimbo de data/hora
As consultas de carimbo de data/hora permitem que os aplicativos meçam o tempo de execução dos comandos da GPU com precisão de nanossegundos. No entanto, a especificação da WebGPU torna as consultas de carimbo de data/hora opcionais devido a problemas de ataque de temporização. A equipe do Chrome acredita que a quantização das consultas de carimbo de data/hora oferece um bom compromisso entre precisão e segurança, reduzindo a resolução para 100 microssegundos. Consulte issue dawn:1800.
No Chrome, os usuários podem desativar a quantificação de carimbos de data/hora ativando a flag "WebGPU Developer Features" em chrome://flags/#enable-webgpu-developer-features
. Essa sinalização por si só não ativa o recurso "timestamp-query"
. A implementação ainda é experimental e, portanto, requer a flag "Unsafe WebGPU Support" em chrome://flags/#enable-unsafe-webgpu
.
No Dawn, um novo interruptor de dispositivo chamado "timestamp_quantization" foi adicionado e ativado por padrão. O snippet a seguir mostra como permitir o recurso experimental "consulta de carimbo de data/hora" sem quantização de carimbo de data/hora ao solicitar um dispositivo.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Recursos de limpeza de primavera
O recurso experimental "timestamp-query-inside-passes" foi renomeado para "chromium-experimental-timestamp-query-inside-passes" para deixar claro aos desenvolvedores que esse recurso é experimental e está disponível apenas em navegadores baseados no Chromium no momento. Consulte o problema dawn:1193 (link em inglês).
O recurso experimental "pipeline-statistics-query", que só foi implementado parcialmente, foi removido porque não está mais em desenvolvimento. Consulte o problema chromium:1177506.
Isso abrange apenas alguns dos principais destaques. Confira a lista completa de commits.
Novidades na WebGPU
Uma lista de tudo o que foi abordado na série O que há de novo na WebGPU.
Chrome 131
- Distâncias de clipes na WGSL
- GPUCanvasContext getConfiguration()
- Os primitivos de ponto e linha não podem ter viés de profundidade
- Funções integradas de verificação inclusiva para subgrupos
- Suporte experimental para multidraw indireto
- Opção de compilação do módulo do sombreador: matemática rigorosa
- O método requestAdapterInfo() do GPUAdapter foi removido
- Atualizações do Dawn
Chrome 130
- Combinação de fontes duplas
- Melhorias no tempo de compilação de sombreador no Metal
- Descontinuação do método requestAdapterInfo() do GPUAdapter
- Atualizações do amanhecer
Chrome 129
- Suporte a HDR com o modo de mapeamento de tons da tela
- Suporte a subgrupos expandidos
- Atualizações do Dawn
Chrome 128
- Testar subgrupos
- A descontinuação da configuração de viés de profundidade para linhas e pontos
- Ocultar o aviso do DevTools de erro não capturado se preventDefault
- A WGSL interpola a amostragem primeiro e
- Atualizações do Dawn
Chrome 127
- Suporte experimental para OpenGL ES no Android
- Atributo de informações do GPUAdapter
- Melhorias na interoperabilidade do WebAssembly
- Melhoria nos erros do codificador de comando
- Atualizações do Dawn
Chrome 126
- Aumento do limite de maxTextureArrayLayers
- Otimização de upload de buffer para o back-end do Vulkan
- Melhorias no tempo de compilação de sombreador
- Os buffers de comando enviados precisam ser exclusivos
- Atualizações do Dawn
Chrome 125
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte aos service workers e workers compartilhados
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do Dawn
Chrome 123
- Suporte para funções integradas do DP4a na WGSL
- Parâmetros de ponteiro irrestrito na WGSL
- Açúcar sintático para desreferenciar compósitos na WGSL
- Estado somente leitura separado para aspectos de stencil e profundidade
- Atualizações do Dawn
Chrome 122
- Ampliar o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumento do limite de maxVertexAttributes
- Atualizações do Dawn
Chrome 121
- Suporte à WebGPU no Android
- Usar DXC em vez de FXC para a compilação de shaders no Windows
- Consultas de carimbo de data/hora em passagens de computação e renderização
- Pontos de entrada padrão para módulos de sombreador
- Suporte a display-p3 como espaço de cores GPUExternalTexture
- Informações sobre heaps de memória
- Atualizações do Dawn
Chrome 120
- Suporte a valores de ponto flutuante de 16 bits na WGSL
- Superar os limites
- Mudanças no estado de profundidade do estêncil
- Atualizações de informações sobre adaptadores
- Quantização de consultas de carimbo de data/hora
- Recursos de limpeza geral
Chrome 119
- Texturas flutuantes de 32 bits com filtro
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do Dawn
Chrome 118
- Compatibilidade de HTMLImageElement e ImageData em
copyExternalImageToTexture()
- Suporte experimental para textura de armazenamento de leitura/gravação e somente leitura
- Atualizações do Dawn
Chrome 117
- Não definir buffer de vértice
- Cancelar configuração do grupo de vinculação
- Silenciar erros da criação de pipeline assíncrono quando o dispositivo é perdido
- Atualizações na criação de módulos de sombreador SPIR-V
- Como melhorar a experiência do desenvolvedor
- Pipelines em cache com layout gerado automaticamente
- Atualizações do Dawn
Chrome 116
- Integração com o WebCodecs
- Dispositivo perdido retornado por GPUAdapter
requestDevice()
- Manter a reprodução de vídeo suave se
importExternalTexture()
for chamado - Conformidade com as especificações
- Como melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 115
- Extensões de linguagem WGSL com suporte
- Suporte experimental para Direct3D 11
- Acessar a GPU discreta por padrão na alimentação CA
- Como melhorar a experiência do desenvolvedor
- Atualizações do amanhecer
Chrome 114
- Otimizar o JavaScript
- getCurrentTexture() em uma tela não configurada gera um erro InvalidStateError
- Atualizações da WGSL
- Atualizações do Dawn