Novidades da WebGPU (Chrome \n128)

François Beaufort
François Beaufort

Testando subgrupos

O recurso de subgrupos ativa o paralelismo no nível de SIMD, permitindo que as linhas de execução de um grupo se comuniquem e realizem operações matemáticas coletivas (por exemplo, calcular a soma de 16 números). Isso oferece uma forma altamente eficiente de compartilhamento de dados entre linhas de execução.

Uma implementação mínima da proposta de subgrupos está disponível para testes locais no "Suporte WebGPU não segura" em chrome://flags/#enable-unsafe-webgpu.

Você também pode testar subgrupos no seu site com usuários reais. Para isso, inscreva-se no teste de origem. Leia o artigo Começar a usar testes de origem para ver instruções sobre como preparar seu site para esses testes. O teste de origem será executado no Chrome 128 ao 131 (encerramento em 19 de fevereiro de 2025). Consulte Intenção de fazer experimentos.

Quando o recurso "subgroups" estiver disponível em um GPUAdapter, solicite um GPUDevice com esse recurso para receber suporte a subgrupos na WGSL e verificar os limites de minSubgroupSize e maxSubgroupSize.

Também é necessário ativar explicitamente essa extensão no código da WGSL com enable subgroups;. Quando esse recurso estiver ativado, você terá acesso às seguintes adições:

  • subgroup_invocation_id: um valor integrado para o índice da linha de execução no subgrupo.
  • subgroup_size: um valor integrado para acesso ao tamanho do subgrupo.
  • subgroupBallot(value): retorna um conjunto de campos de bits em que o bit correspondente a subgroup_invocation_id é 1 se value for verdadeiro para a invocação ativa. Caso contrário, é 0.
  • subgroupBroadcast(value, id): transmite o value da invocação com subgroup_invocation_id correspondente a id para todas as invocações dentro do subgrupo. Observação: id precisa ser uma constante de tempo de compilação.

Mais funções integradas, como subgroupAdd, subgroupAll, subgroupElect e subgroupShuffle, serão adicionadas no futuro. Consulte o problema 354738715.

Para permitir f16 em operações de subgrupos, solicite um GPUDevice com os recursos "subgroups", "subgroups-f16" e "shader-f16" e ative-o no código WGSL com enable f16, subgroups, subgroups_f16;.

O snippet de código a seguir fornece uma base para mexer e descobrir o potencial dos subgrupos.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

Suspender o uso da configuração de viés de profundidade para linhas e pontos

Uma mudança na especificação da WebGPU torna um erro de validação definir depthBias, depthBiasSlopeScale e depthBiasClamp com um valor diferente de zero quando a topologia de um pipeline de renderização é do tipo de linha ou ponto. Para dar aos desenvolvedores tempo suficiente para atualizar o código, um aviso no Console do DevTools é mostrado sobre essa validação futura e, ao mesmo tempo, força os valores para 0 nessas circunstâncias. Consulte o problema 352567424.

Ocultar aviso de erro não capturado do DevTools se preventDefault

No Console do DevTools, os avisos para eventos uncapturederror não serão mais exibidos se um listener de eventos para uncapturederror tiver sido registrado e o método preventDefault() de evento tiver sido chamado no callback do listener. Esse comportamento corresponde ao tratamento de eventos em JavaScript. Confira o exemplo a seguir e o problema 40263619 (link em inglês).

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

A WGSL interpola primeiro a amostragem

O atributo interpolate da WGSL permite gerenciar a interpolação de dados de E/S definida pelo usuário. Agora, os novos parâmetros de amostragem de interpolação first (padrão) e either oferecem controle adicional: first usa o valor do primeiro vértice do primitivo, enquanto either permite o primeiro ou o último vértice. Consulte o problema 340278447.

Atualizações do amanhecer

A implementação do WGPUFuture da Dawn para lidar com operações assíncronas foi concluída. Os principais conceitos incluem wgpuInstanceProcessEvents para processamento de eventos oportunistas e WGPUCallbackMode para definir locais de callbacks. WGPUFuture significa eventos únicos com ciclo de vida infinito, e wgpuInstanceWaitAny aguardam a conclusão de qualquer futuro ou tempo limite. Consulte o problema 42240932.

O valor CompositeAlphaMode::Auto agora não é informado por Surface::GetCapabilities(). Ainda é válido e equivalente a Surface::GetCapabilities().alphaMode[0]. Consulte o problema 292.

O back-end do OpenGL agora oferece suporte a Surface com uma linha "y-flip" para cada chamada de Present(). Consulte o problema 344814083.

O método Adapter::GetProperties() foi descontinuado e substituído pelo uso de Adapter::GetInfo().

Jaswant, um colaborador externo, reescreveu todos os arquivos CMake, facilitando a atualização deles e permitindo pré-builds. Confira o guia de início rápido para usar o Dawn em projetos do CMake.

Isso cobre apenas alguns dos principais destaques. Confira a lista completa de confirmações (link em inglês).

Novidades da WebGPU

Uma lista de tudo o que foi abordado na série O que há de novo na WebGPU.

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113