Suporte a valores de ponto flutuante de 16 bits na WGSL
Na WGSL, o tipo f16
é o conjunto de valores de ponto flutuante de 16 bits do formato IEEE-754 binary16 (meia precisão). Isso significa que ele usa 16 bits para representar um número de ponto flutuante, em vez de 32 bits para ponto flutuante de precisão única convencional (f32
). Esse tamanho menor pode levar a melhorias de desempenho significativas, especialmente ao processar grandes quantidades de dados.
Em um dispositivo Apple M1 Pro, a implementação de f16
dos modelos Llama2 7B usados na demonstração do chat WebLLM (link em inglês) é significativamente mais rápida do que a implementação de f32
, com uma melhoria de 28% na velocidade de preenchimento automático e de 41% na velocidade de decodificação, conforme mostrado nas capturas de tela a seguir.
Nem todas as GPUs são compatíveis com valores de ponto flutuante de 16 bits. Quando o recurso "shader-f16"
estiver disponível em um GPUAdapter
, você poderá solicitar um GPUDevice
com esse recurso e criar um módulo de sombreador WGSL que use o tipo de ponto flutuante de meia precisão f16
. Esse tipo só será válido para uso no módulo de sombreador da WGSL se você ativar a extensão da WGSL f16
com enable f16;
. Caso contrário, createShaderModule() gera um erro de validação. Confira o exemplo mínimo a seguir e o issue dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
É possível oferecer suporte aos tipos f16
e f32
no código do módulo de sombreador da WGSL com um alias
, dependendo do suporte ao recurso "shader-f16"
, conforme mostrado no snippet a seguir.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Supere os limites
Por padrão, o número máximo de bytes necessários para conter uma amostra (pixel ou subpixel) dos dados de saída do pipeline de renderização em todos os anexos de cores é de 32 bytes. Agora é possível pedir até 64 usando o limite maxColorAttachmentBytesPerSample
. Confira o exemplo a seguir e o issue dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Os limites de maxInterStageShaderVariables
e maxInterStageShaderComponents
usados para comunicação entre estágios aumentaram em todas as plataformas. Consulte o problema dawn:1448 (link em inglês) para ver mais detalhes.
Para cada estágio do sombreador, o número máximo de entradas de layout de grupo de vinculação em um layout de pipeline que são buffers de armazenamento é oito por padrão. Agora é possível solicitar até 10 usando o limite maxStorageBuffersPerShaderStage
. Consulte problema dawn:2159.
Um novo limite de maxBindGroupsPlusVertexBuffers
foi adicionado. Ela consiste no número máximo de slots de grupo de vinculação e de buffer de vértice usados simultaneamente, contando os slots vazios abaixo do índice mais alto. O valor padrão é 24. Consulte problema dawn:1849.
Mudanças no estado de estêncil de profundidade
Para melhorar a experiência do desenvolvedor, os atributos de estado de estêncil de profundidade depthWriteEnabled
e depthCompare
nem sempre são necessários: depthWriteEnabled
é necessário apenas para formatos com profundidade, e depthCompare
não é necessário para formatos com profundidade se não for usado. Consulte problema dawn:2132.
Atualizações de informações do adaptador
Os atributos de informações do adaptador type
e backend
não padrão agora estão disponíveis ao chamar requestAdapterInfo() quando o usuário ativa a flag "Recursos do desenvolvedor da WebGPU" em chrome://flags/#enable-webgpu-developer-features
. O type
pode ser "GPU discreta", "GPU integrada", "CPU" ou "desconhecida". O backend
é "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" ou "null". Consulte issue dawn:2112 e issue dawn:2107.
O parâmetro de lista opcional unmaskHints
em requestAdapterInfo() foi removido. Consulte Problema dawn:1427.
Quantização de consultas de carimbo de data/hora
As consultas de carimbo de data/hora permitem que os aplicativos meçam o tempo de execução dos comandos da GPU com precisão de nanossegundos. No entanto, a especificação da WebGPU torna as consultas de carimbo de data/hora opcionais devido a preocupações com ataques de tempo. A equipe do Chrome acredita que quantificar consultas de carimbo de data/hora proporciona um meio-termo entre precisão e segurança, reduzindo a resolução para 100 microssegundos. Consulte Problema dawn:1800.
No Chrome, os usuários podem desativar a quantização de carimbo de data/hora ativando a sinalização "Recursos do desenvolvedor da WebGPU" em chrome://flags/#enable-webgpu-developer-features
. Essa sinalização por si só não ativa o recurso "timestamp-query"
. A implementação dela ainda é experimental e, portanto, exige o flag "Suporte não seguro à WebGPU" em chrome://flags/#enable-unsafe-webgpu
.
No Dawn, um novo botão de alternância do dispositivo chamado "timestamp_quantization" foi adicionado e fica ativado por padrão. O snippet a seguir mostra como permitir o recurso experimental "consulta de carimbo de data/hora" sem quantização de carimbo de data/hora ao solicitar um dispositivo.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Recursos para fazer uma limpeza na primavera
O recurso experimental "timestamp-query-inside-passes" foi renomeado como "chromium-experimental-timestamp-query-inside-passs" para deixar claro para os desenvolvedores que esse recurso é experimental e, por enquanto, está disponível apenas em navegadores baseados no Chromium. Consulte Problema dawn:1193.
O recurso experimental "pipeline-statistics-query", que só foi implementado parcialmente, foi removido porque não está mais sendo desenvolvido. Consulte o problema chromium:1177506.
Esses são apenas alguns dos principais destaques. Confira a lista completa de confirmações (link em inglês).
Novidades da WebGPU
Uma lista de tudo o que foi abordado na série O que há de novo na WebGPU.
Chrome 125
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte para service workers e workers compartilhados
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do amanhecer
Chrome 123
- Suporte para funções integradas do DP4a na WGSL
- Parâmetros de ponteiro irrestrito na WGSL
- Simplificação da sintaxe para desreferenciar compostos na WGSL
- Separar o estado somente leitura para aspectos de estêncil e profundidade
- Atualizações do amanhecer
Chrome 122
- Expandir o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumentar o limite maxVertexAttributes
- Atualizações do amanhecer
Chrome 121
- Suporte para WebGPU no Android
- Usar DXC em vez de FXC para compilação de sombreador no Windows
- Consultas de carimbo de data/hora em passagens de computação e renderização
- Pontos de entrada padrão para módulos de sombreador
- Suporte a display-p3 como espaço de cores GPUExternalTexture
- Informações sobre heaps de memória
- Atualizações do amanhecer
Google Chrome 120
- Suporte para valores de ponto flutuante de 16 bits na WGSL
- Supere os limites
- Mudanças no estado do estêncil de profundidade
- Atualizações de informações sobre os adaptadores
- Quantização de consultas de carimbo de data/hora
- Recursos para limpeza de primavera
Chrome 119
- Texturas flutuantes de 32 bits filtráveis
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do amanhecer
Chrome 118
- Suporte para HTMLImageElement e ImageData no
copyExternalImageToTexture()
- Suporte experimental para textura de leitura/gravação e armazenamento somente leitura
- Atualizações do amanhecer
Chrome 117
- Buffer de vértice não definido
- Grupo de vinculação não definido
- Silenciar erros da criação de pipeline assíncrono quando o dispositivo é perdido
- Atualizações na criação do módulo de sombreador SPIR-V
- Melhorias na experiência do desenvolvedor
- Pipelines de armazenamento em cache com layout gerado automaticamente
- Atualizações do amanhecer
Chrome 116
- Integração do WebCodecs
- Dispositivo perdido retornado pelo GPUAdapter
requestDevice()
- Manter a reprodução do vídeo suave se
importExternalTexture()
for chamado - Conformidade com especificações
- Melhorias na experiência do desenvolvedor
- Atualizações do amanhecer
Chrome 115
- Extensões de idioma da WGSL compatíveis
- Suporte experimental para Direct3D 11
- Receber GPU discreta por padrão com alimentação CA
- Melhorias na experiência do desenvolvedor
- Atualizações do amanhecer
Chrome 114
- Optimize JavaScript
- getCurrentTexture() na tela não configurada gera InvalidStateError.
- Atualizações da WGSL
- Atualizações do amanhecer