Compatibilidad con funciones integradas de DP4a en WGSL
DP4a (producto escalar de 4 elementos y acumulación) hace referencia a un conjunto de instrucciones de GPU que se usan comúnmente en la inferencia de aprendizaje profundo para la cuantificación. Realiza productos punto de números enteros de 8 bits de manera eficiente para acelerar el procesamiento de esos modelos cuantizados en int8. Puede ahorrar hasta un 75% de la memoria y el ancho de banda de la red, y mejorar el rendimiento de cualquier modelo de aprendizaje automático en la inferencia en comparación con su versión f32. Como resultado, ahora se usa mucho en muchos frameworks populares de IA.
Cuando la extensión de lenguaje "packed_4x8_integer_dot_product"
WGSL está presente en navigator.gpu.wgslLanguageFeatures
, ahora puedes usar escalares de números enteros de 32 bits que empaquetan vectores de 4 componentes de números enteros de 8 bits como entradas para las instrucciones de producto escalar en tu código de sombreador WGSL con las funciones integradas dot4U8Packed
y dot4I8Packed
. También puedes usar instrucciones de empaquetado y desempaquetado con vectores empaquetados de 4 componentes de números enteros de 8 bits con las funciones integradas de WGSL pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
y unpack4xU8
.
Se recomienda usar una directiva de requisitos para indicar la posibilidad de no portabilidad con requires packed_4x8_integer_dot_product;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y el problema tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Agradecemos especialmente al equipo de gráficos web de Intel en Shanghái por impulsar la finalización de esta especificación y su implementación.
Parámetros de puntero sin restricciones en WGSL
La extensión de lenguaje "unrestricted_pointer_parameters"
de WGSL relaja las restricciones sobre qué punteros se pueden pasar a las funciones de WGSL:
Punteros de parámetros de los espacios de direcciones
storage
,uniform
yworkgroup
para las funciones declaradas por el usuario.Paso de punteros a miembros de estructuras y elementos de arrays a funciones declaradas por el usuario
Consulta Pointers As Function Parameters | Tour of WGSL para obtener más información.
Esta función se puede detectar con navigator.gpu.wgslLanguageFeatures
. Se recomienda usar siempre una directiva de requisitos para indicar la posibilidad de no portabilidad con requires unrestricted_pointer_parameters;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo, los cambios en la especificación de WGSL y el problema tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Azúcar sintáctico para la desreferenciación de compuestos en WGSL
Cuando la extensión de lenguaje "pointer_composite_access"
WGSL está presente en navigator.gpu.wgslLanguageFeatures
, tu código de sombreador WGSL ahora admite el acceso a componentes de tipos de datos complejos con la misma sintaxis de punto (.
), ya sea que trabajes directamente con los datos o con un puntero a ellos. Aquí te mostramos cómo funciona:
Si
foo
es un puntero,foo.bar
es una forma más conveniente de escribir(*foo).bar
. Normalmente, se necesitaría el asterisco (*
) para convertir el puntero en una "referencia" que se pueda desreferenciar, pero ahora los punteros y las referencias son mucho más similares y casi intercambiables.Si
foo
no es un puntero, el operador de punto (.
) funciona exactamente como lo hace para acceder directamente a los miembros.
Del mismo modo, si pa
es un puntero que almacena la dirección inicial de un array, usar pa[i]
te da acceso directo a la ubicación de memoria en la que se almacena el elemento 'i
del array.
Se recomienda usar una directiva de requisitos para indicar la posibilidad de no portabilidad con requires pointer_composite_access;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y el problema de tinte:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Estado de solo lectura independiente para los aspectos de plantilla y profundidad
Anteriormente, los archivos adjuntos de profundidad y esténcil de solo lectura en los pases de renderización requerían que ambos aspectos (profundidad y esténcil) fueran de solo lectura. Se levantó esta limitación. Ahora puedes usar el aspecto de profundidad en modo de solo lectura, por ejemplo, para el trazado de sombras de contacto, mientras se escribe en el búfer de stencil para identificar píxeles para su posterior procesamiento. Consulta el problema dawn:2146.
Actualizaciones de Dawn
La devolución de llamada de error no capturado establecida con wgpuDeviceSetUncapturedErrorCallback()
ahora se llama de inmediato cuando ocurre el error. Esto es lo que los desarrolladores esperan y desean de forma constante para la depuración. Consulta change dawn:173620.
Se implementó el método wgpuSurfaceGetPreferredFormat()
de la API de webgpu.h. Consulta el problema dawn:1362.
Esto solo abarca algunos de los aspectos destacados clave. Consulta la lista exhaustiva de confirmaciones.
Novedades de WebGPU
Una lista de todo lo que se abordó en la serie Novedades de WebGPU
Chrome 140
- Las solicitudes de dispositivos consumen el adaptador
- Abreviatura para usar la textura donde se usa la vista de textura
- WGSL textureSampleLevel admite texturas 1D
- Se da de baja el uso de texturas de almacenamiento de solo lectura bgra8unorm
- Se quitó el atributo isFallbackAdapter de GPUAdapter
- Actualizaciones de Dawn
Chrome 139
- Compatibilidad con texturas 3D para formatos comprimidos BC y ASTC
- Nueva función "core-features-and-limits"
- Prueba de origen para el modo de compatibilidad de WebGPU
- Actualizaciones de Dawn
Chrome 138
- Abreviatura para usar el búfer como recurso de vinculación
- Cambios en los requisitos de tamaño para los búferes asignados en la creación
- Informe de arquitectura para las GPUs recientes
- Se dejó de usar el atributo isFallbackAdapter de GPUAdapter
- Actualizaciones de Dawn
Chrome 137
- Usa la vista de textura para la vinculación de externalTexture
- Los búferes se copian sin especificar desplazamientos ni tamaño
- WGSL workgroupUniformLoad con puntero a atómico
- Atributo powerPreference de GPUAdapterInfo
- Se quitó el atributo compatibilityMode de GPURequestAdapterOptions
- Actualizaciones de Dawn
Chrome 136
- Atributo isFallbackAdapter de GPUAdapterInfo
- Mejoras en el tiempo de compilación de sombreadores en D3D12
- Cómo guardar y copiar imágenes de lienzos
- Restricciones del modo de compatibilidad de efectividad
- Actualizaciones de Dawn
Chrome 135
- Permite crear un diseño de canalización con un diseño de grupo de vinculación nulo
- Permite que los puertos de visualización se extiendan más allá de los límites de los destinos de renderización
- Acceso más fácil al modo de compatibilidad experimental en Android
- Se quitó el límite de maxInterStageShaderComponents
- Actualizaciones de Dawn
Chrome 134
- Mejora las cargas de trabajo de aprendizaje automático con subgrupos
- Se quitó la compatibilidad con tipos de texturas filtrables de punto flotante como combinables
- Actualizaciones de Dawn
Chrome 133
- Formatos de vértices adicionales de unorm8x4-bgra y de 1 componente
- Permitir que se soliciten límites desconocidos con un valor indefinido
- Cambios en las reglas de alineación de WGSL
- Mejoras en el rendimiento de WGSL con descarte
- Cómo usar displaySize de VideoFrame para texturas externas
- Cómo controlar imágenes con orientaciones no predeterminadas con copyExternalImageToTexture
- Mejora de la experiencia de los desarrolladores
- Habilita el modo de compatibilidad con featureLevel
- Limpieza de las funciones experimentales de subgrupos
- Se baja el límite de maxInterStageShaderComponents
- Actualizaciones de Dawn
Chrome 132
- Uso de la vista de textura
- Combinación de texturas de punto flotante de 32 bits
- Atributo adapterInfo de GPUDevice
- Configurar el contexto del lienzo con un formato no válido arroja un error de JavaScript
- Restricciones del muestreador de filtrado en texturas
- Experimentación con subgrupos extendidos
- Mejora de la experiencia de los desarrolladores
- Compatibilidad experimental con formatos de texturas normalizadas de 16 bits
- Actualizaciones de Dawn
Chrome 131
- Distancias de recorte en WGSL
- GPUCanvasContext getConfiguration()
- Las primitivas de puntos y líneas no deben tener sesgo de profundidad
- Funciones integradas de análisis inclusivo para subgrupos
- Compatibilidad experimental con multi-draw indirect
- Opción de compilación del módulo de sombreador strict math
- Se quitó requestAdapterInfo() de GPUAdapter
- Actualizaciones de Dawn
Chrome 130
- Combinación de dos fuentes
- Mejoras en el tiempo de compilación de sombreadores en Metal
- Obsolescencia de requestAdapterInfo() de GPUAdapter
- Actualizaciones de Dawn
Chrome 129
- Compatibilidad con HDR con el modo de ajuste de tonos del lienzo
- Compatibilidad ampliada con subgrupos
- Actualizaciones de Dawn
Chrome 128
- Experimentación con subgrupos
- Se dejó de admitir el parámetro de configuración del sesgo de profundidad para líneas y puntos
- Oculta la advertencia de error no capturado de Herramientas para desarrolladores si se llama a preventDefault
- WGSL interpola el muestreo primero y, luego,
- Actualizaciones de Dawn
Chrome 127
- Compatibilidad experimental con OpenGL ES en Android
- Atributo info de GPUAdapter
- Mejoras en la interoperabilidad de WebAssembly
- Se mejoraron los errores del codificador de comandos
- Actualizaciones de Dawn
Chrome 126
- Aumenta el límite de maxTextureArrayLayers
- Optimización de la carga de búferes para el backend de Vulkan
- Mejoras en el tiempo de compilación de sombreadores
- Los búferes de comandos enviados deben ser únicos
- Actualizaciones de Dawn
Chrome 125
Chrome 124
- Texturas de almacenamiento de solo lectura y lectura y escritura
- Compatibilidad con Service Workers y Shared Workers
- Nuevos atributos de información del adaptador
- Correcciones de errores
- Actualizaciones de Dawn
Chrome 123
- Compatibilidad con funciones integradas de DP4a en WGSL
- Parámetros de puntero sin restricciones en WGSL
- Azúcar sintáctico para la desreferenciación de compuestos en WGSL
- Estado de solo lectura independiente para los aspectos de profundidad y estarcido
- Actualizaciones de Dawn
Chrome 122
- Expande el alcance con el modo de compatibilidad (función en desarrollo)
- Aumenta el límite de maxVertexAttributes
- Actualizaciones de Dawn
Chrome 121
- Compatibilidad con WebGPU en Android
- Usa DXC en lugar de FXC para la compilación de sombreadores en Windows
- Consultas de marcas de tiempo en pases de procesamiento y cómputos
- Puntos de entrada predeterminados a los módulos de sombreadores
- Admite display-p3 como espacio de color GPUExternalTexture
- Información de montones de memoria
- Actualizaciones de Dawn
Chrome 120
- Compatibilidad con valores de punto flotante de 16 bits en WGSL
- Supera tus límites
- Cambios en el estado de profundidad y estencil
- Actualizaciones de la información del adaptador
- Cuantificación de consultas de marca de tiempo
- Funciones de limpieza de primavera
Chrome 119
- Texturas de punto flotante de 32 bits filtrables
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Actualizaciones de Dawn
Chrome 118
- Compatibilidad con HTMLImageElement y ImageData en
copyExternalImageToTexture()
- Compatibilidad experimental con texturas de almacenamiento de lectura y escritura y de solo lectura
- Actualizaciones de Dawn
Chrome 117
- Anula la configuración del búfer de vértices
- Anula la configuración del grupo de vinculaciones
- Silencia los errores de la creación de canalizaciones asíncronas cuando se pierde el dispositivo
- Actualizaciones en la creación de módulos de sombreadores SPIR-V
- Mejora de la experiencia de los desarrolladores
- Canalizaciones de almacenamiento en caché con diseño generado automáticamente
- Actualizaciones de Dawn
Chrome 116
- Integración de WebCodecs
- El dispositivo perdido que devolvió GPUAdapter
requestDevice()
- Mantener la reproducción de video fluida si se llama a
importExternalTexture()
- Cumplimiento de las especificaciones
- Mejora de la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 115
- Extensiones de lenguaje WGSL admitidas
- Compatibilidad experimental con Direct3D 11
- Obtén una GPU discreta de forma predeterminada con alimentación de CA
- Mejora de la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 114
- Optimiza JavaScript
- getCurrentTexture() en un lienzo sin configurar arroja InvalidStateError
- Actualizaciones de WGSL
- Actualizaciones de Dawn