Novedades de WebGPU (Chrome 128)

François Beaufort
François Beaufort

Experimenta con subgrupos

La función de subgrupos habilita el paralelismo a nivel de SIMD, lo que permite que los subprocesos dentro de un grupo se comuniquen y realicen operaciones matemáticas colectivas (por ejemplo, calcular la suma de 16 números). Esto proporciona una forma muy eficiente de compartir datos entre subprocesos.

Hay disponible una implementación mínima de la propuesta de subgrupos para pruebas locales detrás de la marca "Compatibilidad no segura con WebGPU" en chrome://flags/#enable-unsafe-webgpu.

También puedes probar los subgrupos en tu sitio con usuarios reales. Para ello, regístrate en la prueba de origen. Lee Comienza a usar las pruebas de origen para obtener instrucciones sobre cómo preparar tu sitio para usar las pruebas de origen. La prueba de origen se ejecutará desde Chrome 128 hasta 131 (finalizará el 19 de febrero de 2025). Consulta Intención de experimentar.

Cuando la función "subgroups" esté disponible en un GPUAdapter, solicita un GPUDevice con esta función para obtener compatibilidad con subgrupos en WGSL y verificar sus límites de minSubgroupSize y maxSubgroupSize.

También debes habilitar esta extensión de forma explícita en tu código WGSL con enable subgroups;. Cuando está habilitado, obtienes acceso a las siguientes incorporaciones:

  • subgroup_invocation_id: Es un valor integrado para el índice del subproceso dentro del subgrupo.
  • subgroup_size: Es un valor integrado para el acceso al tamaño del subgrupo.
  • subgroupBallot(value): Muestra un conjunto de campos de bits en los que el bit correspondiente a subgroup_invocation_id es 1 si value es verdadero para esa invocación activa y 0 de lo contrario.
  • subgroupBroadcast(value, id): Transmite el value de la invocación con subgroup_invocation_id que coincide con id a todas las invocaciones dentro del subgrupo. Nota: id debe ser una constante de tiempo de compilación.

En el futuro, se agregarán más funciones integradas, como subgroupAdd, subgroupAll, subgroupElect y subgroupShuffle. Consulta el problema 354738715.

Para permitir f16 en las operaciones de subgrupos, solicita un GPUDevice con las funciones "subgroups", "subgroups-f16" y "shader-f16" y, luego, habilítala en tu código WGSL con enable f16, subgroups, subgroups_f16;.

El siguiente fragmento de código proporciona una base para experimentar y descubrir el potencial de los subgrupos.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

Se dio de baja la configuración de sesgo de profundidad para líneas y puntos.

Un cambio en las especificaciones de WebGPU hace que sea un error de validación establecer depthBias, depthBiasSlopeScale y depthBiasClamp en un valor distinto de cero cuando la topología de una canalización de renderización es un tipo de línea o punto. Para darles a los desarrolladores tiempo suficiente para actualizar su código, se muestra una advertencia en la consola de Herramientas para desarrolladores sobre esta próxima validación y, al mismo tiempo, se fuerzan los valores a 0 en estas circunstancias. Consulta el problema 352567424.

Oculta la advertencia de DevTools de error no capturado si se usa preventDefault

En la consola de DevTools, ya no se muestran las advertencias para los eventos uncapturederror si se registró un objeto de escucha de eventos para uncapturederror y se llamó al método preventDefault() del evento dentro de la devolución de llamada del objeto de escucha de eventos. Este comportamiento coincide con el control de eventos en JavaScript. Consulta el siguiente ejemplo y el problema 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

WGSL interpola el muestreo primero y, luego, realiza una de las siguientes acciones:

El atributo interpolate de WGSL te permite administrar la interpolación de datos de E/S definidos por el usuario. Ahora, los nuevos parámetros de muestreo de interpolación first (predeterminado) y either te brindan un control adicional: first usa el valor del primer vértice de la primitiva, mientras que either permite el primer o el último vértice. Consulta el problema 340278447.

Actualizaciones de Dawn

Ya se completó la implementación de WGPUFuture de Dawn para controlar operaciones asíncronas. Los conceptos clave incluyen wgpuInstanceProcessEvents para el procesamiento de eventos oportunistas y WGPUCallbackMode para definir ubicaciones de devolución de llamada. WGPUFuture indica eventos únicos con un ciclo de vida infinito, y wgpuInstanceWaitAny espera la finalización de cualquier futuro o un tiempo de espera. Consulta el problema 42240932.

Surface::GetCapabilities() ya no informa el valor CompositeAlphaMode::Auto. Sigue siendo válido y es equivalente a Surface::GetCapabilities().alphaMode[0]. Consulta el problema 292.

El backend de OpenGL ahora admite Surface con un blit de inversión en Y para cada llamada a Present(). Consulta el problema 344814083.

El método Adapter::GetProperties() dejó de estar disponible y se reemplazó por Adapter::GetInfo().

Jaswant, un colaborador externo, reescribió todos los archivos CMake, lo que facilita su actualización y permite compilaciones previas. Consulta la guía de inicio rápido para usar Dawn en proyectos de CMake.

Esto solo abarca algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.

Novedades de WebGPU

Una lista de todo lo que se analizó en la serie Novedades de WebGPU.

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113