Expérimenter avec des sous-groupes
La fonctionnalité de sous-groupes active le parallélisme au niveau du SIMD, ce qui permet aux threads d'un groupe de communiquer et d'effectuer des opérations mathématiques collectives (par exemple, le calcul de la somme de 16 nombres). Cela constitue une forme très efficace de partage de données interthread.
Une implémentation minimale de la proposition de sous-groupes est disponible pour les tests en local dans la section "Unsafe WebGPU Support" (Assistance WebGPU non sécurisée). l'indicateur à chrome://flags/#enable-unsafe-webgpu
.
Vous pouvez également tester des sous-groupes sur votre site avec de vrais utilisateurs en vous inscrivant à la phase d'évaluation. Consultez Premiers pas avec les phases d'évaluation pour savoir comment préparer votre site à les utiliser. La phase d'évaluation s'exécutera de Chrome 128 à 131 (et se terminera le 19 février 2025). Consultez la section Intention de test.
Lorsque la fonctionnalité "subgroups"
est disponible dans un GPUAdapter
, demandez un GPUDevice
avec cette fonctionnalité pour obtenir la prise en charge des sous-groupes dans WGSL et vérifier ses limites minSubgroupSize
et maxSubgroupSize
.
Vous devez également activer explicitement cette extension dans votre code WGSL avec enable subgroups;
. Lorsque cette option est activée, vous avez accès aux ajouts suivants:
subgroup_invocation_id
: valeur intégrée pour l'index du thread dans le sous-groupe.subgroup_size
: valeur intégrée pour l'accès à la taille des sous-groupes.subgroupBallot(value)
: renvoie un ensemble de champs de bits où le bit correspondant àsubgroup_invocation_id
est 1 sivalue
est vrai pour cet appel actif, et 0 dans le cas contraire.subgroupBroadcast(value, id)
: diffusevalue
à partir de l'appel avecsubgroup_invocation_id
correspondant àid
à tous les appels du sous-groupe. Remarque:id
doit être une constante connue à la compilation.
D'autres fonctions intégrées telles que subgroupAdd
, subgroupAll
, subgroupElect
et subgroupShuffle
seront ajoutées ultérieurement. Consultez le problème 354738715.
Pour autoriser f16 dans les opérations de sous-groupes, demandez une GPUDevice
avec les fonctionnalités "subgroups"
, "subgroups-f16"
et "shader-f16"
, puis activez-la dans votre code WGSL avec enable f16, subgroups, subgroups_f16;
.
L'extrait de code suivant fournit une base pour bricoler et découvrir le potentiel des sous-groupes.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Abandon de la définition du biais de profondeur pour les lignes et les points
Une modification de la spécification WebGPU entraîne une erreur de validation lorsque vous définissez depthBias
, depthBiasSlopeScale
et depthBiasClamp
sur une valeur non nulle lorsque la topologie d'un pipeline de rendu est un type de ligne ou de point. Afin de laisser suffisamment de temps aux développeurs pour mettre à jour leur code, un avertissement s'affiche dans la console DevTools concernant cette validation à venir, tout en forçant les valeurs à 0 dans ce cas. Consultez le problème 352567424.
Masquer l'avertissement d'erreur non capturée dans les outils de développement si preventDefault
Dans la console des outils de développement, les avertissements pour les événements uncapturederror
ne s'affichent plus si un écouteur d'événements pour uncapturederror
a été enregistré et que la méthode preventDefault()
d'événement a été appelée dans le rappel de l'écouteur d'événements. Ce comportement correspond à la gestion des événements en JavaScript. Consultez l'exemple suivant et le problème 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
l'interpolation de l'échantillonnage WGSL,
L'attribut WGSL interpolate
vous permet de gérer l'interpolation des données d'E/S définies par l'utilisateur. Désormais, les nouveaux paramètres d'échantillonnage interpolé first
(par défaut) et either
vous offrent un contrôle supplémentaire: first
utilise la valeur du premier sommet de la primitive, tandis que either
autorise le premier ou le dernier sommet. Consultez le problème 340278447.
Actualités de l'aube
L'implémentation du WGPUFuture de Dawn pour gérer les opérations asynchrones est maintenant terminée. Les concepts clés incluent wgpuInstanceProcessEvents pour le traitement des événements opportunistes et WGPUCallbackMode pour définir des emplacements de rappel. WGPUFuture signifie que les événements ponctuels ont une durée de vie infinie et que wgpuInstanceWaitAny attend la fin de tout événement futur ou un délai d'inactivité. Consultez le problème 42240932.
La valeur CompositeAlphaMode::Auto
n'est plus indiquée par Surface::GetCapabilities()
. Elle est toujours valide et équivaut à Surface::GetCapabilities().alphaMode[0]
. Consultez le problème 292.
Le backend OpenGL prend désormais en charge Surface
avec un blit (y-flip) pour chaque appel Present()
. Consultez le problème 344814083.
La méthode Adapter::GetProperties()
a été abandonnée au profit de Adapter::GetInfo()
.
Jaswant, un contributeur externe, a réécrit tous les fichiers CMake, pour les mettre à jour plus facilement et permettre des pré-builds. Consultez le guide de démarrage rapide pour utiliser Dawn dans les projets CMake.
Cette présentation ne porte que sur certains points clés. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tous les sujets abordés dans la série Nouveautés de WebGPU
Chrome 128
- Tester avec des sous-groupes
- Abandon de la définition du biais de profondeur pour les lignes et les points
- Masquer l'avertissement d'erreur non capturée dans les outils de développement si preventDefault
- L'échantillonnage est d'abord interpolé dans WGSL, et
- Informations sur l'aube
Chrome 127
- Compatibilité expérimentale avec OpenGL ES sur Android
- Attribut d'informations GPUAdapter
- Améliorations de l'interopérabilité de WebAssembly
- Amélioration des erreurs liées à l'encodeur de commande
- Informations sur l'aube
Chrome 126
- Augmentation de la limite maxTextureArrayLayers
- Optimisation de l'importation de tampon pour le backend Vulkan
- Amélioration du temps de compilation des nuanceurs
- Les tampons de commande envoyés doivent être uniques
- Informations sur l'aube
Chrome 125
- Sous-groupes (fonctionnalité en cours de développement)
- Effectuer le rendu d'une tranche de texture 3D
- Informations sur l'aube
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Assistance pour les service workers et les workers partagés
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Informations sur l'aube
Chrome 123
- Fonctions intégrées DP4a dans WGSL
- Paramètres de pointeur sans restriction dans WGSL
- Syntaxe sucré pour déréférencer les composites dans WGSL
- État de lecture seule distinct pour les aspects de pochoir et de profondeur
- Informations sur l'aube
Chrome 122
- Élargir la couverture avec le mode de compatibilité (fonctionnalité en développement)
- Augmenter la limite maximale de VertexAttributes
- Informations sur l'aube
Chrome 121
- Compatibilité avec WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation du nuanceur sous Windows
- Requêtes d'horodatage dans les passes de calcul et de rendu
- Points d'entrée par défaut des modules de nuanceurs
- Prise en charge de display-p3 en tant qu'espace colorimétrique GPUExternalTexture
- Informations sur les tas de mémoire
- Informations sur l'aube
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repoussez les limites
- Modifications apportées à l'état de profondeur au stencil
- Mises à jour des informations sur l'adaptateur
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures de float 32 bits filtrables
- Format de sommet unorm10-10-10-2
- rgb10a2uint format de texture
- Informations sur l'aube
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture()
- Compatibilité expérimentale avec les textures de stockage en lecture/écriture et en lecture seule
- Informations sur l'aube
Chrome 117
- Tampon de sommets non défini
- Désactiver le groupe de liaisons
- Couper le son des erreurs liées à la création d'un pipeline asynchrone en cas de perte de l'appareil
- Modifications apportées à la création du module de nuanceur SPIR-V
- Améliorer l'expérience des développeurs
- Mettre en cache des pipelines avec une mise en page générée automatiquement
- Informations sur l'aube
Chrome 116
- Intégration de WebCodecs
- Appareil perdu renvoyé par GPUAdapter
requestDevice()
- Maintenir la lecture vidéo fluide si
importExternalTexture()
est appelé - Conformité des spécifications
- Améliorer l'expérience des développeurs
- Informations sur l'aube
Chrome 115
- Extensions de langage WGSL compatibles
- Compatibilité expérimentale avec Direct3D 11
- Utiliser un GPU distinct par défaut sur secteur
- Améliorer l'expérience des développeurs
- Informations sur l'aube
Chrome 114
- Optimiser JavaScript
- getCurrentTexture() sur un canevas non configuré génère InvalidStateError
- Informations concernant WGSL
- Informations sur l'aube