Compatibilidad con funciones integradas de DP4a en WGSL
DP4a (Dot Product of 4 Elements and Accumulate) hace referencia a un conjunto de instrucciones de GPU de uso frecuente en la inferencia de aprendizaje profundo para la cuantización. Realiza de manera eficiente productos punto de números enteros de 8 bits para acelerar el cálculo de esos modelos cuantizados de int8. Puede ahorrar (hasta un 75%) de la memoria y el ancho de banda de la red, y mejorar el rendimiento de cualquier modelo de aprendizaje automático en la inferencia en comparación con su versión f32. Como resultado, ahora se usa mucho en muchos frameworks populares de IA.
Cuando la "packed_4x8_integer_dot_product" extensión de lenguaje WGSL está presente en navigator.gpu.wgslLanguageFeatures, ahora puedes usar escalares de números enteros de 32 bits que empaquetan vectores de 4 componentes de números enteros de 8 bits como entradas para las instrucciones de producto punto en tu código de sombreador WGSL con las funciones integradas dot4U8Packed y dot4I8Packed. También puedes usar instrucciones de empaquetado y desempaquetado con vectores empaquetados de 4 componentes de números enteros de 8 bits con las funciones integradas de WGSL pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 y unpack4xU8.
Se recomienda usar una directiva requires para indicar la posible falta de portabilidad con requires packed_4x8_integer_dot_product; en la parte superior del código de sombreador WGSL. Consulta el siguiente ejemplo y el problema tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Agradecemos especialmente al equipo de Web Graphics de Intel en Shanghái por impulsar esta especificación y su implementación hasta su finalización.
Parámetros de puntero sin restricciones en WGSL
La "unrestricted_pointer_parameters" extensión de lenguaje WGSL relaja las restricciones sobre qué punteros se pueden pasar a las funciones de WGSL:
Punteros de parámetros de los espacios de direcciones
storage,uniformyworkgroupa las funciones declaradas por el usuario.Paso de punteros a miembros de estructura y elementos de array a funciones declaradas por el usuario.
Consulta Pointers As Function Parameters | Tour of WGSL para obtener más información.
Esta función se puede detectar con navigator.gpu.wgslLanguageFeatures. Se recomienda usar siempre una directiva requires para indicar la posible falta de portabilidad con requires unrestricted_pointer_parameters; en la parte superior del código de sombreador WGSL. Consulta el siguiente ejemplo, los cambios en las especificaciones de WGSL y el problema tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Azúcar sintáctico para desreferenciar compuestos en WGSL
Cuando la extensión de "pointer_composite_access" lenguaje WGSL está presente en navigator.gpu.wgslLanguageFeatures, tu código de sombreador WGSL ahora admite el acceso a componentes de tipos de datos complejos con la misma sintaxis de punto (.), ya sea que trabajes directamente con los datos o con un puntero a ellos. Aquí te mostramos cómo funciona:
Si
fooes un puntero,foo.bares una forma más conveniente de escribir(*foo).bar. Normalmente, se necesitaría el asterisco (*) para convertir el puntero en una "referencia" que se pueda desreferenciar, pero ahora los punteros y las referencias son mucho más similares y casi intercambiables.Si
foono es un puntero, el operador de punto (.) funciona exactamente como estás acostumbrado a acceder directamente a los miembros.
Del mismo modo, si pa es un puntero que almacena la dirección inicial de un array, usar pa[i] te da acceso directo a la ubicación de la memoria en la que se almacena el elemento 'i' de ese array.
Se recomienda usar una directiva requires para indicar la posible falta de portabilidad con requires pointer_composite_access; en la parte superior del código de sombreador WGSL. Consulta el siguiente ejemplo y el problema tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Estado de solo lectura separado para aspectos de plantilla y profundidad
Anteriormente, los adjuntos de plantilla y profundidad de solo lectura en los pases de renderización requerían que ambos aspectos (profundidad y plantilla) fueran de solo lectura. Se levantó esta limitación. Ahora, puedes usar el aspecto de profundidad en modo de solo lectura, por ejemplo, para el seguimiento de sombras de contacto, mientras que se escribe en el búfer de plantilla para identificar píxeles para su procesamiento posterior. Consulta el problema dawn:2146.
Actualizaciones de Dawn
La devolución de llamada de error no capturado establecida con wgpuDeviceSetUncapturedErrorCallback() ahora se llama de inmediato cuando se produce el error. Esto es lo que los desarrolladores esperan y desean de manera constante para la depuración. Consulta el cambio dawn:173620.
Se implementó el método wgpuSurfaceGetPreferredFormat() de la API de webgpu.h. Consulta el problema dawn:1362.
Esto solo abarca algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.
Novedades de WebGPU
Una lista de todo lo que se abarcó en la serie Novedades de WebGPU.
Chrome 147-148
Chrome 146
- Compatibilidad con el modo de compatibilidad de WebGPU en OpenGL ES 3.1
- Adjuntos transitorios
- Extensión texture_and_sampler_let de WGSL
- Actualizaciones de Dawn
Chrome 145
- Extensión subgroup_uniformity de WGSL
- Asignación de búfer síncrono experimental en trabajadores
- Actualizaciones de Dawn
Chrome 144
- Extensión subgroup_id de WGSL
- Extensión uniform_buffer_standard_layout de WGSL
- WebGPU en Linux
- writeBuffer y writeTexture más rápidos
- Actualizaciones de Dawn
Chrome 143
- Swizzle de componentes de textura
- Quitar el uso de texturas de almacenamiento de solo lectura bgra8unorm
- Actualizaciones de Dawn
Chrome 142
- Se ampliaron las capacidades de compatibilidad con formatos de textura
- Índice primitivo en WGSL
- Actualizaciones de Dawn
Chrome 141
- Se completó Tint IR
- Análisis de rango de números enteros en el compilador de WGSL
- Actualización de SPIR-V 1.4 para el backend de Vulkan
- Actualizaciones de Dawn
Chrome 140
- Las solicitudes de dispositivos consumen el adaptador
- Abreviatura para usar la textura donde se usa la vista de textura
- textureSampleLevel de WGSL admite texturas 1D
- Da de baja el uso de texturas de almacenamiento de solo lectura bgra8unorm
- Quita el atributo isFallbackAdapter de GPUAdapter
- Actualizaciones de Dawn
Chrome 139
- Compatibilidad con texturas 3D para formatos comprimidos BC y ASTC
- Nueva función "core-features-and-limits"
- Prueba de origen para el modo de compatibilidad de WebGPU
- Actualizaciones de Dawn
Chrome 138
- Abreviatura para usar el búfer como un recurso de vinculación
- Cambios en los requisitos de tamaño para los búferes asignados en la creación
- Informe de arquitectura para GPUs recientes
- Da de baja el atributo isFallbackAdapter de GPUAdapter
- Actualizaciones de Dawn
Chrome 137
- Usa la vista de textura para la vinculación externalTexture
- Los búferes se copian sin especificar compensaciones ni tamaño
- workgroupUniformLoad de WGSL con puntero a atómico
- Atributo powerPreference de GPUAdapterInfo
- Quita el atributo compatibilityMode de GPURequestAdapterOptions
- Actualizaciones de Dawn
Chrome 136
- Atributo isFallbackAdapter de GPUAdapterInfo
- Mejoras en el tiempo de compilación de sombreadores en D3D12
- Guarda y copia imágenes de lienzo
- Levanta las restricciones del modo de compatibilidad
- Actualizaciones de Dawn
Chrome 135
- Permite crear un diseño de canalización con un diseño de grupo de vinculaciones nulo
- Permite que los viewports se extiendan más allá de los límites de los objetivos de renderización
- Acceso más fácil al modo de compatibilidad experimental en Android
- Quita el límite maxInterStageShaderComponents
- Actualizaciones de Dawn
Chrome 134
- Mejora las cargas de trabajo de aprendizaje automático con subgrupos
- Quita la compatibilidad con tipos de texturas filtrables de números de punto flotante como combinables
- Actualizaciones de Dawn
Chrome 133
- Formatos de vértices adicionales unorm8x4-bgra y de 1 componente
- Permite solicitar límites desconocidos con un valor indefinido
- Cambios en las reglas de alineación de WGSL
- Ganancias de rendimiento de WGSL con descarte
- Usa displaySize de VideoFrame para texturas externas
- Controla imágenes con orientaciones no predeterminadas con copyExternalImageToTexture
- Mejora la experiencia de los desarrolladores
- Habilita el modo de compatibilidad con featureLevel
- Limpieza de funciones experimentales de subgrupos
- Da de baja el límite maxInterStageShaderComponents
- Actualizaciones de Dawn
Chrome 132
- Uso de la vista de textura
- Combinación de texturas de números de punto flotante de 32 bits
- Atributo adapterInfo de GPUDevice
- Configurar el contexto de lienzo con un formato no válido arroja un error de JavaScript
- Restricciones de muestreo de filtros en texturas
- Experimentación extendida de subgrupos
- Mejora la experiencia de los desarrolladores
- Compatibilidad experimental con formatos de texturas normalizados de 16 bits
- Actualizaciones de Dawn
Chrome 131
- Recorta distancias en WGSL
- GPUCanvasContext getConfiguration()
- Las primitivas de punto y línea no deben tener sesgo de profundidad
- Funciones integradas de exploración inclusiva para subgrupos
- Compatibilidad experimental con multi-draw indirect
- Opción de compilación de módulos de sombreadores strict math
- Quita GPUAdapter requestAdapterInfo()
- Actualizaciones de Dawn
Chrome 130
- Combinación de fuentes duales
- Mejoras en el tiempo de compilación de sombreadores en Metal
- Baja de GPUAdapter requestAdapterInfo()
- Actualizaciones de Dawn
Chrome 129
- Compatibilidad con HDR con el modo de asignación de tonos de lienzo
- Compatibilidad expandida con subgrupos
- Actualizaciones de Dawn
Chrome 128
- Experimentación con subgrupos
- Da de baja la configuración del sesgo de profundidad para líneas y puntos
- Oculta la advertencia de Herramientas para desarrolladores de error no capturado si preventDefault
- WGSL interpola el muestreo primero y cualquiera
- Actualizaciones de Dawn
Chrome 127
- Compatibilidad experimental con OpenGL ES en Android
- Atributo info de GPUAdapter
- Mejoras en la interoperabilidad de WebAssembly
- Errores mejorados del codificador de comandos
- Actualizaciones de Dawn
Chrome 126
- Aumenta el límite maxTextureArrayLayers
- Optimización de la carga de búfer para el backend de Vulkan
- Mejoras en el tiempo de compilación de sombreadores
- Los búferes de comandos enviados deben ser únicos
- Actualizaciones de Dawn
Chrome 125
Chrome 124
- Texturas de almacenamiento de solo lectura y lectura y escritura
- Compatibilidad con service workers y shared workers
- Nuevos atributos de información del adaptador
- Correcciones de errores
- Actualizaciones de Dawn
Chrome 123
- Compatibilidad con funciones integradas de DP4a en WGSL
- Parámetros de puntero sin restricciones en WGSL
- Sintaxis edulcorada para desreferenciar compuestos en WGSL
- Estado de solo lectura separado para aspectos de plantilla y profundidad
- Actualizaciones de Dawn
Chrome 122
- Expande el alcance con el modo de compatibilidad (función en desarrollo)
- Aumenta el límite maxVertexAttributes
- Actualizaciones de Dawn
Chrome 121
- Compatibilidad con WebGPU en Android
- Usa DXC en lugar de FXC para la compilación de sombreadores en Windows
- Consultas de marcas de tiempo en pases de cómputos y renderización
- Puntos de entrada predeterminados para módulos de sombreadores
- Compatibilidad con display-p3 como espacio de color GPUExternalTexture
- Información de los montones de memoria
- Actualizaciones de Dawn
Chrome 120
- Compatibilidad con valores de punto flotante de 16 bits en WGSL
- Supera los límites
- Cambios en el estado de plantilla y profundidad
- Actualizaciones de la información del adaptador
- Cuantización de consultas de marcas de tiempo
- Funciones de limpieza de primavera
Chrome 119
- Texturas filtrables de números de punto flotante de 32 bits
- Formato de vértices unorm10-10-10-2
- Formato de textura rgb10a2uint
- Actualizaciones de Dawn
Chrome 118
- Compatibilidad con HTMLImageElement y ImageData en
copyExternalImageToTexture() - Compatibilidad experimental con texturas de almacenamiento de lectura y escritura y de solo lectura
- Actualizaciones de Dawn
Chrome 117
- Búfer de vértices no establecido
- Grupo de vinculaciones no establecido
- Silencia los errores de la creación de canalizaciones asíncronas cuando se pierde el dispositivo
- Actualizaciones de la creación de módulos de sombreadores SPIR-V
- Mejora la experiencia de los desarrolladores
- Canalizaciones de almacenamiento en caché con diseño generado automáticamente
- Actualizaciones de Dawn
Chrome 116
- Integración de WebCodecs
- Dispositivo perdido que muestra GPUAdapter
requestDevice() - Mantén la reproducción de video fluida si se llama a
importExternalTexture() - Conformidad con las especificaciones
- Mejora la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 115
- Extensiones de lenguaje WGSL compatibles
- Compatibilidad experimental con Direct3D 11
- Obtén una GPU discreta de forma predeterminada con alimentación de CA
- Mejora la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 114
- Optimiza JavaScript
- getCurrentTexture() en un lienzo no configurado arroja InvalidStateError
- Actualizaciones de WGSL
- Actualizaciones de Dawn