Tester des sous-groupes
La fonctionnalité de sous-groupes permet le parallélisme au niveau SIMD, ce qui permet aux threads d'un groupe de communiquer et d'effectuer des opérations mathématiques collectives (par exemple, calculer la somme de 16 nombres). Cela permet de partager des données entre les threads de manière très efficace.
Une implémentation minimale de la proposition de sous-groupes est disponible pour les tests locaux derrière le flag "Unsafe WebGPU Support" (Prise en charge WebGPU non sécurisée) sur chrome://flags/#enable-unsafe-webgpu
.
Vous pouvez également essayer les sous-groupes sur votre site avec de vrais utilisateurs en vous inscrivant à l'Origin Trial. Pour savoir comment préparer votre site à utiliser les versions d'essai des fonctionnalités, consultez Premiers pas avec les versions d'essai des fonctionnalités. L'évaluation de l'origine se déroulera de Chrome 128 à Chrome 131 (jusqu'au 19 février 2025). Consultez Intention de tester.
Lorsque la fonctionnalité "subgroups"
est disponible dans un GPUAdapter
, demandez un GPUDevice
avec cette fonctionnalité pour obtenir la prise en charge des sous-groupes dans WGSL et vérifiez ses limites minSubgroupSize
et maxSubgroupSize
.
Vous devez également activer explicitement cette extension dans votre code WGSL avec enable subgroups;
. Si vous l'activez, vous aurez accès aux ajouts suivants :
subgroup_invocation_id
: valeur intégrée pour l'index du thread dans le sous-groupe.subgroup_size
: valeur intégrée pour l'accès à la taille du sous-groupe.subgroupBallot(value)
: renvoie un ensemble de champs de bits où le bit correspondant àsubgroup_invocation_id
est défini sur 1 sivalue
est défini sur "true" pour cette invocation active, et sur 0 dans le cas contraire.subgroupBroadcast(value, id)
: diffuse levalue
de l'appel avecsubgroup_invocation_id
correspondant àid
à tous les appels du sous-groupe. Remarque :id
doit être une constante de temps de compilation.
D'autres fonctions intégrées, telles que subgroupAdd
, subgroupAll
, subgroupElect
et subgroupShuffle
, seront ajoutées à l'avenir. Consultez le problème 354738715.
Pour autoriser f16 dans les opérations de sous-groupes, demandez un GPUDevice
avec les fonctionnalités "subgroups"
, "subgroups-f16"
et "shader-f16"
, puis activez-le dans votre code WGSL avec enable f16, subgroups, subgroups_f16;
.
L'extrait de code suivant fournit une base pour expérimenter et découvrir le potentiel des sous-groupes.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Abandon du paramètre de biais de profondeur pour les lignes et les points
Une modification de la spécification WebGPU fait que la définition de depthBias
, depthBiasSlopeScale
et depthBiasClamp
sur une valeur non nulle constitue une erreur de validation lorsque la topologie d'un pipeline de rendu est de type ligne ou point. Pour donner aux développeurs suffisamment de temps pour mettre à jour leur code, un avertissement s'affiche dans la console des outils de développement concernant cette prochaine validation, tout en forçant les valeurs à 0 dans ces circonstances. Consultez le problème 352567424.
Masquer l'avertissement d'erreur non capturée des outils de développement si preventDefault
Dans la console d'outils de développement, les avertissements concernant les événements uncapturederror
ne s'affichent plus si un écouteur d'événements pour uncapturederror
a été enregistré et que la méthode preventDefault()
de l'événement a été appelée dans le rappel de l'écouteur d'événements. Ce comportement correspond à la gestion des événements en JavaScript. Consultez l'exemple suivant et le problème 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL interpolate sampling first and either
L'attribut WGSL interpolate
vous permet de gérer l'interpolation des données d'E/S définies par l'utilisateur. Désormais, les nouveaux paramètres d'échantillonnage d'interpolation first
(par défaut) et either
vous offrent un contrôle supplémentaire : first
utilise la valeur du premier sommet de la primitive, tandis que either
autorise le premier ou le dernier sommet. Consultez le problème 340278447.
Mises à jour de l'Aube
L'implémentation de WGPUFuture de Dawn pour gérer les opérations asynchrones est désormais terminée. Les concepts clés incluent wgpuInstanceProcessEvents pour le traitement opportuniste des événements et WGPUCallbackMode pour définir les emplacements des rappels. WGPUFuture désigne des événements ponctuels avec une durée de vie infinie, et wgpuInstanceWaitAny attend la fin d'un futur ou un délai d'attente. Consultez le problème 42240932.
La valeur CompositeAlphaMode::Auto
n'est plus signalée par Surface::GetCapabilities()
. Il est toujours valide et équivaut à Surface::GetCapabilities().alphaMode[0]
. Consultez le problème 292.
Le backend OpenGL est désormais compatible avec Surface
avec un blit d'inversion Y pour chaque appel Present()
. Consultez le problème 344814083.
La méthode Adapter::GetProperties()
est obsolète. Utilisez plutôt Adapter::GetInfo()
.
Jaswant, un contributeur externe, a réécrit tous les fichiers CMake, ce qui les rend plus faciles à mettre à jour et permet les pré-compilations. Consultez le guide de démarrage rapide pour utiliser Dawn dans les projets CMake.
Il ne s'agit que de quelques-uns des points clés. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tous les sujets abordés dans la série Nouveautés de WebGPU.
Chrome 140
- Les demandes d'appareils consomment l'adaptateur
- Raccourci pour utiliser une texture lorsqu'une vue de texture est utilisée
- WGSL textureSampleLevel prend en charge les textures 1D
- Abandon de l'utilisation de textures de stockage en lecture seule bgra8unorm
- Suppression de l'attribut GPUAdapter isFallbackAdapter
- Informations sur Dawn
Chrome 139
- Prise en charge des textures 3D pour les formats compressés BC et ASTC
- Nouvelle fonctionnalité "core-features-and-limits"
- Phase d'évaluation de l'origine pour le mode de compatibilité WebGPU
- Informations sur Dawn
Chrome 138
- Raccourci pour utiliser le tampon comme ressource de liaison
- Modifications des exigences de taille pour les tampons mappés lors de la création
- Rapport sur l'architecture des GPU récents
- Obsolescence de l'attribut GPUAdapter isFallbackAdapter
- Informations sur Dawn
Chrome 137
- Utiliser la vue de texture pour la liaison externalTexture
- Copier des tampons sans spécifier de décalages ni de taille
- WGSL workgroupUniformLoad utilisant un pointeur vers un atome
- Attribut powerPreference de GPUAdapterInfo
- Suppression de l'attribut compatibilityMode de GPURequestAdapterOptions
- Informations sur Dawn
Chrome 136
- Attribut GPUAdapterInfo isFallbackAdapter
- Améliorations du temps de compilation des nuanceurs sur D3D12
- Enregistrer et copier des images du canevas
- Restrictions du mode Compatibilité avec Lift
- Informations sur Dawn
Chrome 135
- Autoriser la création d'une mise en forme de pipeline avec une mise en forme de groupe de liaisons nulle
- Autoriser les fenêtres d'affichage à s'étendre au-delà des limites des cibles de rendu
- Accès plus facile au mode de compatibilité expérimental sur Android
- Supprimer la limite maxInterStageShaderComponents
- Informations sur Dawn
Chrome 134
- Améliorer les charges de travail de machine learning avec des sous-groupes
- Supprimer la prise en charge des types de textures filtrables flottantes en tant que textures mélangeables
- Informations sur Dawn
Chrome 133
- Formats de vertex unorm8x4-bgra et à un seul composant supplémentaires
- Autoriser les limites inconnues à être demandées avec une valeur indéfinie
- Modifications des règles d'alignement WGSL
- Gains de performances WGSL avec "discard"
- Utiliser displaySize VideoFrame pour les textures externes
- Gérer les images avec des orientations non définies par défaut à l'aide de copyExternalImageToTexture
- Améliorer l'expérience des développeurs
- Activer le mode Compatibilité avec featureLevel
- Nettoyage des fonctionnalités expérimentales de sous-groupes
- Abandon de la limite maxInterStageShaderComponents
- Informations sur Dawn
Chrome 132
- Utilisation de la vue Texture
- Mélange de textures flottantes 32 bits
- Attribut adapterInfo de GPUDevice
- La configuration du contexte du canevas avec un format non valide génère une erreur JavaScript
- Restrictions du filtreur d'échantillonneur sur les textures
- Tests étendus des sous-groupes
- Améliorer l'expérience des développeurs
- Prise en charge expérimentale des formats de texture normalisés 16 bits
- Informations sur Dawn
Chrome 131
- Distances de clipping dans WGSL
- GPUCanvasContext getConfiguration()
- Les primitives de points et de lignes ne doivent pas avoir de biais de profondeur
- Fonctions intégrées d'analyse inclusive pour les sous-groupes
- Compatibilité expérimentale avec le dessin indirect multiple
- Option de compilation du module de nuanceur "strict math"
- Suppression de GPUAdapter requestAdapterInfo()
- Informations sur Dawn
Chrome 130
- Combinaison de deux sources
- Amélioration du temps de compilation des nuanceurs sur Metal
- Obsolescence de GPUAdapter requestAdapterInfo()
- Informations sur Dawn
Chrome 129
- Compatibilité HDR avec le mode de mappage des tons du canevas
- Prise en charge étendue des sous-groupes
- Informations sur Dawn
Chrome 128
- Tester les sous-groupes
- Obsolète : définir le biais de profondeur pour les lignes et les points
- Masquer l'avertissement d'erreur non capturée dans les outils pour les développeurs si preventDefault
- WGSL interpolate sampling first and either
- Informations sur Dawn
Chrome 127
- Prise en charge expérimentale d'OpenGL ES sur Android
- Attribut info de GPUAdapter
- Améliorations de l'interopérabilité WebAssembly
- Amélioration des erreurs d'encodeur de commandes
- Informations sur Dawn
Chrome 126
- Augmenter la limite maxTextureArrayLayers
- Optimisation de l'importation de tampon pour le backend Vulkan
- Améliorations du temps de compilation des nuanceurs
- Les tampons de commandes envoyés doivent être uniques
- Informations sur Dawn
Chrome 125
- Sous-groupes (fonction en cours de développement)
- Afficher dans une tranche de texture 3D
- Informations sur Dawn
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Compatibilité avec les service workers et les shared workers
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Informations sur Dawn
Chrome 123
- Compatibilité des fonctions intégrées DP4a dans WGSL
- Paramètres de pointeur non restreints dans WGSL
- Sucre syntaxique pour la déréférence des composites dans WGSL
- État de lecture seule distinct pour les aspects de pochoir et de profondeur
- Informations sur Dawn
Chrome 122
- Élargir votre couverture avec le mode de compatibilité (fonctionnalité en cours de développement)
- Augmenter la limite maxVertexAttributes
- Informations sur Dawn
Chrome 121
- Assistance pour WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation des nuanceurs sur Windows
- Requêtes de code temporel dans les passes de calcul et de rendu
- Points d'entrée par défaut des modules de nuanceur
- Prise en charge de display-p3 en tant qu'espace colorimétrique GPUExternalTexture
- Informations sur les tas de mémoire
- Informations sur Dawn
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repousser les limites
- Modifications apportées à l'état de profondeur/stencil
- Mise à jour des informations sur l'adaptateur
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures flottantes de 32 bits filtrables
- Format de vertex unorm10-10-10-2
- Format de texture rgb10a2uint
- Informations sur Dawn
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture()
- Prise en charge expérimentale des textures de stockage en lecture/écriture et en lecture seule
- Informations sur Dawn
Chrome 117
- Désactiver le tampon de vertex
- Supprimer le groupe de liaisons
- Masquer les erreurs liées à la création de pipelines asynchrones lorsque l'appareil est perdu
- Modifications apportées à la création de modules de nuanceur SPIR-V
- Améliorer l'expérience des développeurs
- Pipelines de mise en cache avec mise en page générée automatiquement
- Informations sur Dawn
Chrome 116
- Intégration de WebCodecs
- Appareil égaré renvoyé par GPUAdapter
requestDevice()
- Lecture vidéo fluide si
importExternalTexture()
est appelé - Conformité des spécifications
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 115
- Extensions de langage WGSL acceptées
- Compatibilité expérimentale avec Direct3D 11
- Obtenir un GPU discret par défaut sur secteur
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 114
- Optimize JavaScript
- getCurrentTexture() sur un canevas non configuré génère une erreur InvalidStateError
- Mises à jour de WGSL
- Informations sur Dawn