Compatibilidad con funciones integradas de DP4a en WGSL
DP4a (producto punto de 4 elementos y acumulación) hace referencia a un conjunto de instrucciones de GPU que se usan comúnmente en la inferencia de aprendizaje profundo para la cuantificación. Realiza de manera eficiente productos punto de números enteros de 8 bits para acelerar el procesamiento de esos modelos cuantificados de int8. Puede ahorrar (hasta un 75%) de la memoria y el ancho de banda de la red, y mejorar el rendimiento de cualquier modelo de aprendizaje automático en la inferencia en comparación con su versión f32. Como resultado, ahora se usa mucho en muchos frameworks de IA populares.
Cuando la extensión de lenguaje "packed_4x8_integer_dot_product"
de WGSL está presente en navigator.gpu.wgslLanguageFeatures
, ahora puedes usar escalares enteros de 32 bits que empaquetan vectores de 4 componentes de números enteros de 8 bits como entradas para las instrucciones del producto punto en tu código de sombreador WGSL con las funciones integradas dot4U8Packed
y dot4I8Packed
. También puedes usar instrucciones de empaquetado y desempaquetado con vectores de 4 componentes empaquetados de números enteros de 8 bits con las funciones integradas de WGSL pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
y unpack4xU8
.
Se recomienda usar una directiva requires para indicar la posibilidad de no portabilidad con requires packed_4x8_integer_dot_product;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y issue tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Agradecemos especialmente al equipo de gráficos web de Intel en Shanghai por llevar a cabo esta especificación y su implementación.
Parámetros de puntero sin restricciones en WGSL
La extensión de lenguaje "unrestricted_pointer_parameters"
de WGSL relaja las restricciones sobre los punteros que se pueden pasar a las funciones de WGSL:
Los punteros de parámetros de
storage
,uniform
yworkgroup
dirigen espacios de direcciones a las funciones declaradas por el usuario.Pasar punteros a miembros de estructura y elementos de array a funciones declaradas por el usuario
Consulta Punteros como parámetros de función | Visita de WGSL para obtener más información.
Esta función se puede detectar con navigator.gpu.wgslLanguageFeatures
. Se recomienda usar siempre una directiva obligatoria para indicar el potencial de no portabilidad con requires unrestricted_pointer_parameters;
en la parte superior del código de sombreador WGSL. Consulta el siguiente ejemplo, los cambios en las especificaciones de WGSL y issue tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Sintaxis enriquecida para la anulación de referencias de compuestos en WGSL
Cuando la extensión de lenguaje de WGSL "pointer_composite_access"
está presente en navigator.gpu.wgslLanguageFeatures
, tu código de sombreador WGSL ahora admite el acceso a componentes de tipos de datos complejos con la misma sintaxis de punto (.
), ya sea que trabajes directamente con los datos o con un puntero. A continuación, le indicamos cómo funciona:
Si
foo
es un puntero,foo.bar
es una forma más conveniente de escribir(*foo).bar
. Normalmente, el asterisco (*
) se necesitaría para convertir el puntero en una "referencia" que se pueda anular la referencia, pero ahora tanto los punteros como las referencias son mucho más similares y casi intercambiables.Si
foo
no es un puntero, el operador de punto (.
) funciona exactamente como de costumbre para acceder directamente a los miembros.
De manera similar, si pa
es un puntero que almacena la dirección de inicio de un array, el uso de pa[i]
te da acceso directo a la ubicación de la memoria en la que se almacena el elemento 'i
de ese array.
Se recomienda usar una directiva requires para indicar la posibilidad de no portabilidad con requires pointer_composite_access;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y issue tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Estado de solo lectura independiente para los aspectos de plantilla y profundidad
Antes, los adjuntos de plantillas de profundidad de solo lectura en los pases de renderización requerían que ambos aspectos (profundidad y plantilla) fueran de solo lectura. Se eliminó esta limitación. Ahora, puedes usar el aspecto de profundidad en modo de solo lectura, por ejemplo, para el seguimiento de sombras de contactos, mientras que el búfer de plantillas se escribe con el objetivo de identificar píxeles para su procesamiento posterior. Consulta el problema dawn:2146.
Actualizaciones de Dawn
Ahora se llama de inmediato a la devolución de llamada de error no capturada establecida con wgpuDeviceSetUncapturedErrorCallback()
cuando se produce el error. Esto es lo que los desarrolladores esperan y quieren para la depuración de manera constante. Consulta cambiar amanecer:173620.
Se implementó el método wgpuSurfaceGetPreferredFormat()
de la API de webgpu.h. Consulta problema dawn:1362.
Esto solo abarca algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.
Novedades de WebGPU
Una lista de todo lo que se analizó en la serie Novedades de WebGPU.
Chrome 131
- Cómo recortar distancias en WGSL
- GPUCanvasContext getConfiguration().
- Las primitivas de punto y línea no deben tener sesgo de profundidad
- Funciones integradas de análisis inclusivo para subgrupos
- Compatibilidad experimental con la función indirecta de varios dibujos
- Opción de compilación del módulo de sombreador matemática estricta
- Se quitó requestAdapterInfo() de GPUAdapter
- Actualizaciones de Dawn
Chrome 130
- Combinación de fuentes dobles
- Mejoras en el tiempo de compilación de sombreadores en Metal
- Obsolescencia de requestAdapterInfo() de GPUAdapter
- Actualizaciones del amanecer
Chrome 129
- Compatibilidad con HDR con el modo de asignación de tonos de lienzo
- Compatibilidad expandida con subgrupos
- Actualizaciones de Dawn
Chrome 128
- Experimenta con subgrupos
- Se dio de baja la configuración del sesgo de profundidad para líneas y puntos
- Oculta la advertencia de DevTools de error no capturado si se usa preventDefault
- WGSL interpola el muestreo primero y, luego,
- Actualizaciones de Dawn
Chrome 127
- Compatibilidad experimental con OpenGL ES en Android
- Atributo de información de GPUAdapter
- Mejoras en la interoperabilidad de WebAssembly
- Mejoras en los errores del codificador de comandos
- Actualizaciones de Dawn
Chrome 126
- Se aumentó el límite de maxTextureArrayLayers
- Optimización de la carga de búfer para el backend de Vulkan
- Mejoras en el tiempo de compilación del sombreador
- Los búferes de comandos enviados deben ser únicos
- Actualizaciones del amanecer
Chrome 125
- Subgrupos (función en desarrollo)
- Renderización en una porción de textura 3D
- Actualizaciones de Dawn
Chrome 124
- Texturas de almacenamiento de solo lectura y de lectura y escritura
- Compatibilidad con trabajadores de servicio y trabajadores compartidos
- Nuevos atributos de información del adaptador
- Correcciones de errores
- Actualizaciones de Dawn
Chrome 123
- Compatibilidad con funciones integradas de DP4a en WGSL
- Parámetros de puntero no restringido en WGSL
- Sintaxis enriquecida para la anulación de referencias de objetos compuestos en WGSL
- Estado de solo lectura independiente para los aspectos de plantilla y profundidad
- Actualizaciones de Dawn
Chrome 122
- Expande el alcance con el modo de compatibilidad (función en desarrollo)
- Aumento del límite de maxVertexAttributes
- Actualizaciones de Dawn
Chrome 121
- Compatibilidad con WebGPU en Android
- Usa DXC en lugar de FXC para la compilación de sombreadores en Windows
- Consultas de marcas de tiempo en los pases de procesamiento y renderización
- Puntos de entrada predeterminados a los módulos sombreadores
- Compatibilidad con display-p3 como espacio de color GPUExternalTexture
- Información de los montones de memoria
- Actualizaciones de Dawn
Chrome 120
- Compatibilidad con valores de punto flotante de 16 bits en WGSL
- Supera los límites
- Cambios en el estado de la plantilla de profundidad
- Actualizaciones de la información de los adaptadores
- Cuantización de consultas de marca de tiempo
- Funciones de limpieza de primavera
Chrome 119
- Texturas de punto flotante de 32 bits filtrables
- Formato de vértices unorm10-10-10-2
- Formato de textura rgb10a2uint
- Actualizaciones de Dawn
Chrome 118
- Compatibilidad con ImageData y HTMLImageElement en
copyExternalImageToTexture()
- Compatibilidad experimental con la textura de almacenamiento de lectura y escritura, y de solo lectura
- Actualizaciones del amanecer
Chrome 117
- Cómo anular el búfer de vértices
- Cómo anular el grupo de vinculaciones
- Silencia los errores de la creación de canalización asíncrona cuando se pierde el dispositivo
- Actualizaciones sobre la creación de módulos de sombreadores SPIR-V
- Cómo mejorar la experiencia de los desarrolladores
- Canalizaciones de almacenamiento en caché con diseño generado automáticamente
- Actualizaciones de Dawn
Chrome 116
- Integración de WebCodecs
- Dispositivo perdido que muestra
requestDevice()
de GPUAdapter - Mantén la reproducción de video fluida si se llama a
importExternalTexture()
- Cumplimiento de las especificaciones
- Mejora la experiencia de los desarrolladores
- Actualizaciones del amanecer
Chrome 115
- Extensiones de lenguaje WGSL compatibles
- Compatibilidad experimental con Direct3D 11
- Obtén una GPU discreta de forma predeterminada con alimentación de CA
- Cómo mejorar la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 114
- Optimiza JavaScript
- getCurrentTexture() en el lienzo no configurado arroja InvalidStateError
- Actualizaciones de WGSL
- Actualizaciones de Dawn