Novedades de WebGPU (Chrome 128)

François Beaufort
François Beaufort

Experimenta con subgrupos

La función de subgrupos habilita el paralelismo de nivel SIMD, lo que permite que los subprocesos dentro de un grupo se comuniquen y realicen operaciones matemáticas colectivas (por ejemplo, calcular la suma de 16 números). Esto proporciona una forma muy eficiente de compartir datos entre subprocesos.

Hay una implementación mínima de la propuesta de subgrupos disponible para pruebas locales detrás de la "Compatibilidad no segura con WebGPU". marca en chrome://flags/#enable-unsafe-webgpu.

También puedes probar subgrupos en tu sitio con usuarios reales. Para ello, regístrate en la prueba de origen. Lee Comienza a usar las pruebas de origen si necesitas instrucciones para preparar tu sitio para usar las pruebas de origen. La prueba de origen se realizará de la versión 128 a la 131 de Chrome (finalizará el 19 de febrero de 2025). Consulta Intent para experimentar.

Cuando la función "subgroups" esté disponible en un GPUAdapter, solicita un GPUDevice con esta función para obtener compatibilidad con los subgrupos en WGSL y verificar sus límites de minSubgroupSize y maxSubgroupSize.

También debes habilitar explícitamente esta extensión en tu código WGSL con enable subgroups;. Cuando se habilita, obtienes acceso a las siguientes incorporaciones:

  • subgroup_invocation_id: Es un valor integrado para el índice del subproceso dentro del subgrupo.
  • subgroup_size: Un valor integrado para el acceso al tamaño del subgrupo.
  • subgroupBallot(value): Muestra un conjunto de campos de bits en el que el bit correspondiente a subgroup_invocation_id es 1 si value es verdadero para esa invocación activa y 0 en caso contrario.
  • subgroupBroadcast(value, id): Transmite el value desde la invocación con subgroup_invocation_id que coincida con id a todas las invocaciones dentro del subgrupo. Nota: id debe ser una constante de tiempo de compilación.

En el futuro, se agregarán más funciones integradas, como subgroupAdd, subgroupAll, subgroupElect y subgroupShuffle. Consulta el problema 354738715.

Para permitir f16 en operaciones de subgrupos, solicita un GPUDevice con las funciones "subgroups", "subgroups-f16" y "shader-f16", y luego habilítalo en tu código WGSL con enable f16, subgroups, subgroups_f16;.

El siguiente fragmento de código proporciona una base para experimentar y descubrir el potencial de los subgrupos.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

Baja del sesgo de profundidad para líneas y puntos

Un cambio de especificaciones de WebGPU hace que sea un error de validación configurar depthBias, depthBiasSlopeScale y depthBiasClamp en un valor distinto de cero cuando la topología de una canalización de renderización es un tipo de línea o punto. Para que los desarrolladores tengan tiempo suficiente para actualizar su código, se muestra una advertencia en la consola de Herramientas para desarrolladores sobre esta próxima validación, a la vez que se fuerza a los valores a 0 en estas circunstancias. Consulta el problema 352567424.

Ocultar la advertencia de error no capturado de Herramientas para desarrolladores si preventDefault

En la consola de Herramientas para desarrolladores, ya no se muestran las advertencias sobre los eventos uncapturederror si se registró un objeto de escucha de eventos para uncapturederror y se llamó al método preventDefault() del evento en la devolución de llamada del objeto de escucha de eventos. Este comportamiento coincide con el control de eventos en JavaScript. Consulta el siguiente ejemplo y el error 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

WGSL interpola primero el muestreo y

El atributo interpolate de WGSL te permite administrar la interpolación de datos de IO definida por el usuario. Ahora, los nuevos parámetros de muestreo interpolados first (predeterminado) y either te brindan un control adicional: first usa el valor del primer vértice del primitivo, mientras que either permite el primer o último vértice. Consulta el problema 340278447.

Actualizaciones del amanecer

Se completó la implementación de WGPUFuture de Dawn para controlar operaciones asíncronas. Los conceptos clave incluyen wgpuInstanceProcessEvents para el procesamiento de eventos oportunistas y WGPUCallbackMode para definir ubicaciones de devolución de llamada. WGPUFuture significa eventos únicos con una vida útil infinita, y wgpuInstanceWaitAny espera que se completen cualquier evento futuro o tiempo de espera. Consulta el problema 42240932.

Surface::GetCapabilities() ahora no informa el valor de CompositeAlphaMode::Auto. Sigue siendo válida y equivale a Surface::GetCapabilities().alphaMode[0]. Consulta el problema 292.

El backend de OpenGL ahora admite Surface con un botón y-flip blit para cada llamada a Present(). Consulta el problema 344814083.

El método Adapter::GetProperties() dejó de estar disponible y se reemplazó por Adapter::GetInfo().

Jas want, un colaborador externo, reescribió todos los archivos de CMake, lo que facilita su actualización y permite compilaciones previas. Consulta la guía de inicio rápido para usar Dawn en proyectos de CMake.

Esto abarca solo algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.

Novedades de WebGPU

Una lista de todo lo que se ha abordado en la serie Novedades de WebGPU.

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113