Experimenta con subgrupos
La función de subgrupos habilita el paralelismo a nivel de SIMD, lo que permite que los subprocesos dentro de un grupo se comuniquen y realicen operaciones matemáticas colectivas (por ejemplo, calcular la suma de 16 números). Esto proporciona una forma muy eficiente de compartir datos entre subprocesos.
Hay disponible una implementación mínima de la propuesta de subgrupos para pruebas locales detrás de la marca "Compatibilidad no segura con WebGPU" en chrome://flags/#enable-unsafe-webgpu
.
También puedes probar los subgrupos en tu sitio con usuarios reales. Para ello, regístrate en la prueba de origen. Lee Comienza a usar las pruebas de origen para obtener instrucciones sobre cómo preparar tu sitio para usar las pruebas de origen. La prueba de origen se ejecutará desde Chrome 128 hasta 131 (finalizará el 19 de febrero de 2025). Consulta Intención de experimentar.
Cuando la función "subgroups"
esté disponible en un GPUAdapter
, solicita un GPUDevice
con esta función para obtener compatibilidad con subgrupos en WGSL y verificar sus límites de minSubgroupSize
y maxSubgroupSize
.
También debes habilitar esta extensión de forma explícita en tu código WGSL con enable subgroups;
. Cuando está habilitado, obtienes acceso a las siguientes incorporaciones:
subgroup_invocation_id
: Es un valor integrado para el índice del subproceso dentro del subgrupo.subgroup_size
: Es un valor integrado para el acceso al tamaño del subgrupo.subgroupBallot(value)
: Muestra un conjunto de campos de bits en los que el bit correspondiente asubgroup_invocation_id
es 1 sivalue
es verdadero para esa invocación activa y 0 de lo contrario.subgroupBroadcast(value, id)
: Transmite elvalue
de la invocación consubgroup_invocation_id
que coincide conid
a todas las invocaciones dentro del subgrupo. Nota:id
debe ser una constante de tiempo de compilación.
En el futuro, se agregarán más funciones integradas, como subgroupAdd
, subgroupAll
, subgroupElect
y subgroupShuffle
. Consulta el problema 354738715.
Para permitir f16 en las operaciones de subgrupos, solicita un GPUDevice
con las funciones "subgroups"
, "subgroups-f16"
y "shader-f16"
y, luego, habilítala en tu código WGSL con enable f16, subgroups, subgroups_f16;
.
El siguiente fragmento de código proporciona una base para experimentar y descubrir el potencial de los subgrupos.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Se dio de baja la configuración de sesgo de profundidad para líneas y puntos.
Un cambio en las especificaciones de WebGPU hace que sea un error de validación establecer depthBias
, depthBiasSlopeScale
y depthBiasClamp
en un valor distinto de cero cuando la topología de una canalización de renderización es un tipo de línea o punto. Para darles a los desarrolladores tiempo suficiente para actualizar su código, se muestra una advertencia en la consola de Herramientas para desarrolladores sobre esta próxima validación y, al mismo tiempo, se fuerzan los valores a 0 en estas circunstancias. Consulta el problema 352567424.
Oculta la advertencia de DevTools de error no capturado si se usa preventDefault
En la consola de DevTools, ya no se muestran las advertencias para los eventos uncapturederror
si se registró un objeto de escucha de eventos para uncapturederror
y se llamó al método preventDefault()
del evento dentro de la devolución de llamada del objeto de escucha de eventos. Este comportamiento coincide con el control de eventos en JavaScript. Consulta el siguiente ejemplo y el problema 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL interpola el muestreo primero y, luego, realiza una de las siguientes acciones:
El atributo interpolate
de WGSL te permite administrar la interpolación de datos de E/S definidos por el usuario. Ahora, los nuevos parámetros de muestreo de interpolación first
(predeterminado) y either
te brindan un control adicional: first
usa el valor del primer vértice de la primitiva, mientras que either
permite el primer o el último vértice. Consulta el problema 340278447.
Actualizaciones de Dawn
Ya se completó la implementación de WGPUFuture de Dawn para controlar operaciones asíncronas. Los conceptos clave incluyen wgpuInstanceProcessEvents para el procesamiento de eventos oportunistas y WGPUCallbackMode para definir ubicaciones de devolución de llamada. WGPUFuture indica eventos únicos con un ciclo de vida infinito, y wgpuInstanceWaitAny espera la finalización de cualquier futuro o un tiempo de espera. Consulta el problema 42240932.
Surface::GetCapabilities()
ya no informa el valor CompositeAlphaMode::Auto
. Sigue siendo válido y es equivalente a Surface::GetCapabilities().alphaMode[0]
. Consulta el problema 292.
El backend de OpenGL ahora admite Surface
con un blit de inversión en Y para cada llamada a Present()
. Consulta el problema 344814083.
El método Adapter::GetProperties()
dejó de estar disponible y se reemplazó por Adapter::GetInfo()
.
Jaswant, un colaborador externo, reescribió todos los archivos CMake, lo que facilita su actualización y permite compilaciones previas. Consulta la guía de inicio rápido para usar Dawn en proyectos de CMake.
Esto solo abarca algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.
Novedades de WebGPU
Una lista de todo lo que se analizó en la serie Novedades de WebGPU.
Chrome 132
- Uso de la vista de textura
- Combinación de texturas de punto flotante de 32 bits
- Atributo adapterInfo de GPUDevice
- Configurar el contexto del lienzo con un formato no válido arroja un error de JavaScript
- Filtrado de restricciones de muestreador en texturas
- Experimentación de subgrupos extendidos
- Cómo mejorar la experiencia de los desarrolladores
- Compatibilidad experimental con formatos de textura normalizados de 16 bits
- Actualizaciones de Dawn
Chrome 131
- Cómo recortar distancias en WGSL
- GPUCanvasContext getConfiguration()
- Las primitivas de punto y línea no deben tener sesgo de profundidad
- Funciones integradas de análisis inclusivo para subgrupos
- Compatibilidad experimental con la función indirecta de varios dibujos
- Opción de compilación del módulo de sombreador matemática estricta
- Se quitó requestAdapterInfo() de GPUAdapter
- Actualizaciones de Dawn
Chrome 130
- Combinación de fuentes dobles
- Mejoras en el tiempo de compilación de sombreadores en Metal
- Obsolescencia de requestAdapterInfo() de GPUAdapter
- Actualizaciones de Dawn
Chrome 129
- Compatibilidad con HDR con el modo de ajuste de tonos del lienzo
- Compatibilidad expandida con subgrupos
- Actualizaciones de Dawn
Chrome 128
- Experimenta con subgrupos
- Se dio de baja la configuración del sesgo de profundidad para líneas y puntos
- Oculta la advertencia de DevTools de error no capturado si se usa preventDefault
- WGSL interpola el muestreo primero y, luego,
- Actualizaciones de Dawn
Chrome 127
- Compatibilidad experimental con OpenGL ES en Android
- Atributo de información de GPUAdapter
- Mejoras en la interoperabilidad de WebAssembly
- Se mejoraron los errores del codificador de comandos
- Actualizaciones de Dawn
Chrome 126
- Aumento del límite de maxTextureArrayLayers
- Optimización de la carga de búfer para el backend de Vulkan
- Mejoras en el tiempo de compilación de sombreadores
- Los búferes de comandos enviados deben ser únicos
- Actualizaciones de Dawn
Chrome 125
- Subgrupos (función en desarrollo)
- Renderización en una porción de textura 3D
- Actualizaciones de Dawn
Chrome 124
- Texturas de almacenamiento de solo lectura y de lectura y escritura
- Compatibilidad con trabajadores de servicio y trabajadores compartidos
- Nuevos atributos de información del adaptador
- Correcciones de errores
- Actualizaciones de Dawn
Chrome 123
- Compatibilidad con funciones integradas de DP4a en WGSL
- Parámetros de puntero sin restricciones en WGSL
- Sintaxis enriquecida para la anulación de referencias de objetos compuestos en WGSL
- Estado de solo lectura independiente para los aspectos de plantilla y profundidad
- Actualizaciones de Dawn
Chrome 122
- Expande el alcance con el modo de compatibilidad (función en desarrollo)
- Aumento del límite de maxVertexAttributes
- Actualizaciones de Dawn
Chrome 121
- Compatibilidad con WebGPU en Android
- Usa DXC en lugar de FXC para la compilación de sombreadores en Windows
- Consultas de marca de tiempo en pases de renderización y procesamiento
- Puntos de entrada predeterminados a los módulos sombreadores
- Compatibilidad con display-p3 como espacio de color GPUExternalTexture
- Información de los montones de memoria
- Actualizaciones de Dawn
Chrome 120
- Compatibilidad con valores de punto flotante de 16 bits en WGSL
- Supera los límites
- Cambios en el estado del búfer de profundidad
- Actualizaciones de la información del adaptador
- Cuantización de consultas de marca de tiempo
- Funciones de limpieza de primavera
Chrome 119
- Texturas de punto flotante de 32 bits filtrables
- Formato de vértices unorm10-10-10-2
- Formato de textura rgb10a2uint
- Actualizaciones de Dawn
Chrome 118
- Compatibilidad con HTMLImageElement y ImageData en
copyExternalImageToTexture()
- Compatibilidad experimental con la textura de almacenamiento de lectura y escritura, y de solo lectura
- Actualizaciones de Dawn
Chrome 117
- Cómo anular el búfer de vértices
- Cómo anular el grupo de vinculaciones
- Silencia los errores de la creación de canalización asíncrona cuando se pierde el dispositivo
- Actualizaciones de la creación de módulos de sombreadores SPIR-V
- Cómo mejorar la experiencia de los desarrolladores
- Canalizaciones de almacenamiento en caché con diseño generado automáticamente
- Actualizaciones de Dawn
Chrome 116
- Integración de WebCodecs
- Dispositivo perdido que muestra
requestDevice()
de GPUAdapter - Mantén la reproducción de video fluida si se llama a
importExternalTexture()
- Cumplimiento de las especificaciones
- Cómo mejorar la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 115
- Extensiones de lenguaje WGSL compatibles
- Compatibilidad experimental con Direct3D 11
- Obtén una GPU discreta de forma predeterminada con alimentación de CA
- Cómo mejorar la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 114
- Optimiza JavaScript
- getCurrentTexture() en un lienzo sin configurar arroja InvalidStateError
- Actualizaciones de WGSL
- Actualizaciones de Dawn