Novedades de WebGPU (Chrome 123)

François Beaufort
François Beaufort

Compatibilidad con funciones integradas de la DP4a en WGSL

DP4a (producto de punto de 4 elementos y acumulación) se refiere a un conjunto de instrucciones de GPU de uso general en la inferencia de aprendizaje profundo para la cuantización. Realiza de manera eficiente productos de puntos enteros de 8 bits para acelerar el cálculo de estos modelos cuantificados de int8. Puede ahorrar (hasta un 75%) de memoria y ancho de banda de red, además de mejorar el rendimiento de cualquier modelo de aprendizaje automático en las inferencias, en comparación con su versión f32. Por lo tanto, ahora se usa mucho en muchos frameworks de IA populares.

Cuando la extensión de idioma de WGSL de "packed_4x8_integer_dot_product" está presente en navigator.gpu.wgslLanguageFeatures, ahora puedes usar escalares enteros de 32 bits que empaquetan vectores de 4 componentes de números enteros de 8 bits como entradas para las instrucciones del producto punto en tu código de sombreador WGSL con las funciones integradas dot4U8Packed y dot4I8Packed. También puedes usar instrucciones de empaquetado y desempaquetado con vectores empaquetados de 4 componentes de números enteros de 8 bits con funciones integradas de WGSL, pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 y unpack4xU8.

Se recomienda usar una directiva obligatoria para indicar el potencial de no portabilidad con requires packed_4x8_integer_dot_product; en la parte superior del código de sombreador WGSL. Consulta el siguiente ejemplo y el problema tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Queremos dar un agradecimiento especial al equipo de gráficos web de Intel en Shanghái por completar esta especificación e implementación.

Parámetros de puntero no restringido en WGSL

La extensión de idioma de WGSL "unrestricted_pointer_parameters" flexibiliza las restricciones sobre las que se pueden pasar punteros a funciones de WGSL:

  • Punteros de parámetros de espacios de direcciones storage, uniform y workgroup para funciones declaradas por el usuario

  • Pasar punteros para estructurar miembros y elementos de array a funciones declaradas por el usuario

Consulta Punteros como parámetros de función | Recorrido por WGSL para obtener más información

Esta función se puede detectar con navigator.gpu.wgslLanguageFeatures. Se recomienda usar siempre una directiva obligatoria para indicar el potencial de no portabilidad con requires unrestricted_pointer_parameters; en la parte superior del código de sombreador WGSL. Consulta el siguiente ejemplo, los cambios en las especificaciones de WGSL y el error tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Azúcar de sintaxis para desreferenciar compuestos en WGSL

Cuando la extensión de idioma de WGSL "pointer_composite_access" está presente en navigator.gpu.wgslLanguageFeatures, tu código de sombreador WGSL ahora admite el acceso a componentes de tipos de datos complejos con la misma sintaxis de punto (.), ya sea que trabajes directamente con los datos o con un puntero. A continuación, le indicamos cómo funciona:

  • Si foo es un puntero, foo.bar es una forma más conveniente de escribir (*foo).bar. Normalmente, el asterisco (*) se necesitaría para convertir el puntero en una "referencia" que pueden descartarse, pero ahora tanto los punteros como las referencias son mucho más similares y casi intercambiables.

  • Si foo no es un puntero, el operador del punto (.) funciona exactamente como de costumbre para acceder directamente a los miembros.

De manera similar, si pa es un puntero que almacena la dirección de inicio de un array, el uso de pa[i] te da acceso directo a la ubicación de la memoria en la que se almacena el elemento 'i de ese array.

Se recomienda usar una directiva obligatoria para indicar el potencial de no portabilidad con requires pointer_composite_access; en la parte superior del código de sombreador WGSL. Consulta el siguiente ejemplo y el problema tint:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Separar el estado de solo lectura para los aspectos de esténcil y profundidad

Antes, los adjuntos de plantillas de profundidad de solo lectura en los pases de renderización requerían que ambos aspectos (profundidad y plantilla) fueran de solo lectura. Se eliminó esta limitación. Ahora, puedes usar el aspecto de profundidad en modo de solo lectura, por ejemplo, para el seguimiento de sombras de contactos, mientras que el búfer de plantillas se escribe con el objetivo de identificar píxeles para su procesamiento posterior. Consulta problema dawn:2146.

Actualizaciones del amanecer

Ahora, se llama inmediatamente a la devolución de llamada de error no capturada establecida con wgpuDeviceSetUncapturedErrorCallback() cuando se produce el error. Esto es lo que los desarrolladores esperan y quieren para la depuración de manera constante. Consulta cambiar amanecer:173620.

Se implementó el método wgpuSurfaceGetPreferredFormat() de la API de webgpu.h. Consulta problema dawn:1362.

Esto abarca solo algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.

Novedades de WebGPU

Una lista de todo lo que se ha abordado en la serie Novedades de WebGPU.

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113