Novedades de WebGPU (Chrome 123)

François Beaufort

Compatibilidad con funciones integradas de DP4a en WGSL

DP4a (producto escalar de 4 elementos y acumulación) hace referencia a un conjunto de instrucciones de GPU que se usan comúnmente en la inferencia de aprendizaje profundo para la cuantificación. Realiza productos punto de números enteros de 8 bits de manera eficiente para acelerar el procesamiento de esos modelos cuantizados en int8. Puede ahorrar hasta un 75% de la memoria y el ancho de banda de la red, y mejorar el rendimiento de cualquier modelo de aprendizaje automático en la inferencia en comparación con su versión f32. Como resultado, ahora se usa mucho en muchos marcos de trabajo populares de IA.

Cuando la extensión de lenguaje "packed_4x8_integer_dot_product" WGSL está presente en navigator.gpu.wgslLanguageFeatures, ahora puedes usar escalares de números enteros de 32 bits que empaquetan vectores de 4 componentes de números enteros de 8 bits como entradas para las instrucciones de producto escalar en tu código de sombreador WGSL con las funciones integradas dot4U8Packed y dot4I8Packed. También puedes usar instrucciones de empaquetado y desempaquetado con vectores empaquetados de 4 componentes de números enteros de 8 bits con las funciones integradas de WGSL pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 y unpack4xU8.

Se recomienda usar una directiva de requisitos para indicar la posibilidad de no portabilidad con requires packed_4x8_integer_dot_product; en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y el problema de tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Agradecemos especialmente al equipo de gráficos web de Intel en Shanghái por impulsar la finalización de esta especificación y su implementación.

Parámetros de puntero sin restricciones en WGSL

La "unrestricted_pointer_parameters" extensión de lenguaje de WGSL relaja las restricciones sobre qué punteros se pueden pasar a las funciones de WGSL:

Punteros de parámetros de los espacios de direcciones storage, uniform y workgroup para las funciones declaradas por el usuario.
Paso de punteros a miembros de estructuras y elementos de arrays a funciones declaradas por el usuario

Consulta Pointers As Function Parameters | Tour of WGSL para obtener más información.

Esta función se puede detectar con navigator.gpu.wgslLanguageFeatures. Se recomienda usar siempre una directiva requires para indicar la posibilidad de no portabilidad con requires unrestricted_pointer_parameters; en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo, los cambios en la especificación de WGSL y el problema tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Azúcar sintáctico para la desreferenciación de compuestos en WGSL

Cuando la extensión de lenguaje "pointer_composite_access" WGSL está presente en navigator.gpu.wgslLanguageFeatures, tu código de sombreador WGSL ahora admite el acceso a componentes de tipos de datos complejos con la misma sintaxis de puntos (.), ya sea que trabajes directamente con los datos o con un puntero a ellos. Aquí te mostramos cómo funciona:

Si foo es un puntero, foo.bar es una forma más conveniente de escribir (*foo).bar. Normalmente, se necesitaría el asterisco (*) para convertir el puntero en una "referencia" que se pueda desreferenciar, pero ahora los punteros y las referencias son mucho más similares y casi intercambiables.
Si foo no es un puntero, el operador de punto (.) funciona exactamente como lo hace para acceder directamente a los miembros.

Del mismo modo, si pa es un puntero que almacena la dirección inicial de un array, usar pa[i] te da acceso directo a la ubicación de memoria en la que se almacena el elemento 'i del array.

Se recomienda usar una directiva de requisitos para indicar la posibilidad de no portabilidad con requires pointer_composite_access; en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y el problema de tinte:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Estado de solo lectura independiente para los aspectos de profundidad y plantilla

Anteriormente, los archivos adjuntos de profundidad y esténcil de solo lectura en los pases de renderización requerían que ambos aspectos (profundidad y esténcil) fueran de solo lectura. Esta limitación ya no está vigente. Ahora puedes usar el aspecto de profundidad en modo de solo lectura, por ejemplo, para el trazado de sombras de contacto, mientras se escribe en el búfer de stencil para identificar píxeles para su posterior procesamiento. Consulta el problema dawn:2146.

Actualizaciones de Dawn

La devolución de llamada de error no capturado establecida con wgpuDeviceSetUncapturedErrorCallback() ahora se llama de inmediato cuando ocurre el error. Esto es lo que los desarrolladores esperan y desean de forma constante para la depuración. Consulta change dawn:173620.