Publié le 26 février 2025
Améliorer les charges de travail de machine learning avec des sous-groupes
Après un an de développement et d'essais, la fonctionnalité WebGPU de sous-groupes, qui permet le parallélisme au niveau SIMD, est désormais disponible. Elle permet aux threads d'un groupe de travail de communiquer et d'exécuter des opérations mathématiques collectives, comme le calcul d'une somme de nombres, et offre une méthode efficace de partage de données entre les threads. Consultez la proposition d'origine et l'entrée chromestatus.
À titre de référence, Google Meet a constaté une augmentation de la vitesse de 2,3 à 2,9 fois lors de l'évaluation comparative des sous-groupes par rapport aux produits scalaires d'entiers compressés pour les nuanceurs de multiplication matrice-vecteur sur certains appareils pendant la phase d'évaluation.
Lorsque la fonctionnalité "subgroups" est disponible dans un GPUAdapter, demandez un GPUDevice avec cette fonctionnalité pour bénéficier de la compatibilité avec les sous-groupes dans WGSL. Il est utile de vérifier les valeurs d'informations de l'adaptateur subgroupMinSize et subgroupMaxSize, par exemple si vous disposez d'un algorithme codé en dur qui nécessite un sous-groupe d'une certaine taille.
Vous devez également activer explicitement cette extension dans votre code WGSL avec enable subgroups; pour accéder aux valeurs intégrées suivantes dans les étapes de calcul et de nuanceur de fragment :
subgroup_invocation_id: valeur intégrée pour l'index du thread dans le sous-groupe.subgroup_size: valeur intégrée pour l'accès à la taille du sous-groupe.
Les nombreuses fonctions intégrées de sous-groupes (par exemple, subgroupAdd(), subgroupBallot(), subgroupBroadcast(), subgroupShuffle()) permettent une communication et un calcul efficaces entre les appels d'un sous-groupe. Ces opérations de sous-groupes sont classées comme des opérations SIMT (Single-Instruction Multiple-Thread). De plus, les fonctions intégrées quad, qui fonctionnent sur un quad d'appels, facilitent la communication de données au sein du quad.
Vous pouvez utiliser des valeurs f16 avec des sous-groupes lorsque vous demandez un GPUDevice avec les fonctionnalités "shader-f16" et "subgroups".
L'exemple suivant est un bon point de départ pour explorer les sous-groupes : il montre un nuanceur qui utilise la fonction intégrée subgroupExclusiveMul() pour calculer les factorielles sans lire ni écrire de mémoire afin de communiquer les résultats intermédiaires.
Supprimer la compatibilité avec les types de textures filtrables flottantes en tant que mélangeables
Maintenant que le mélange de textures flottantes 32 bits est disponible avec la fonctionnalité "float32-blendable", la compatibilité incorrecte avec les types de textures filtrables flottantes en tant que mélangeables est supprimée. Consultez le problème 364987733.
Mises à jour de Dawn
Dawn nécessite désormais macOS 11 et iOS 14, et n'est compatible qu'avec Metal 2.3+. Consultez le problème 381117827.
La nouvelle méthode GetWGSLLanguageFeatures() de wgpu::Instance remplace désormais EnumerateWGSLLanguageFeatures(). Consultez le problème 368672124.
Les types de liaison suivants ont une valeur Undefined, et leurs valeurs par défaut dans la mise en page de liaison ont été modifiées. Consultez le problème 377820810.
wgpu::BufferBindingType::Undefinedest désormaisUniformwgpu::SamplerBindingType::Undefinedest désormaisFiltering.wgpu::TextureSampleType::Undefinedest désormaisFloatwgpu::StorageTextureAccess::Undefinedest désormaisWriteOnly
Cela ne couvre que quelques-uns des principaux points forts. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tout ce qui a été abordé dans la série Nouveautés de WebGPU.
Chrome 147-148
Chrome 146
- Compatibilité avec le mode de compatibilité WebGPU sur OpenGL ES 3.1
- Pièces jointes temporaires
- Extension texture_and_sampler_let WGSL
- Mises à jour de Dawn
Chrome 145
- Extension subgroup_uniformity WGSL
- Mappage de mémoire tampon synchrone expérimental dans les nœuds de calcul
- Mises à jour de Dawn
Chrome 144
- Extension subgroup_id WGSL
- Extension uniform_buffer_standard_layout WGSL
- WebGPU sur Linux
- Écriture plus rapide de writeBuffer et writeTexture
- Mises à jour de Dawn
Chrome 143
- Swizzle de composant de texture
- Supprimer l'utilisation de la texture de stockage en lecture seule bgra8unorm
- Mises à jour de Dawn
Chrome 142
- Extension des fonctionnalités de compatibilité avec les formats de texture
- Index primitif dans WGSL
- Mises à jour de Dawn
Chrome 141
- Tint IR terminé
- Analyse de la plage d'entiers dans le compilateur WGSL
- Mise à jour de SPIR-V 1.4 pour le backend Vulkan
- Mises à jour de Dawn
Chrome 140
- Les requêtes d'appareil consomment l'adaptateur
- Raccourci pour utiliser une texture lorsqu'une vue de texture est utilisée
- WGSL textureSampleLevel est compatible avec les textures 1D
- Abandon de l'utilisation de la texture de stockage en lecture seule bgra8unorm
- Supprimer l'attribut GPUAdapter isFallbackAdapter
- Mises à jour de Dawn
Chrome 139
- Compatibilité avec les textures 3D pour les formats compressés BC et ASTC
- Nouvelle fonctionnalité "core-features-and-limits"
- Phase d'évaluation pour le mode de compatibilité WebGPU
- Mises à jour de Dawn
Chrome 138
- Raccourci pour utiliser une mémoire tampon comme ressource de liaison
- Modification des exigences de taille pour les mémoires tampons mappées lors de la création
- Rapport d'architecture pour les GPU récents
- Abandon de l'attribut GPUAdapter isFallbackAdapter
- Mises à jour de Dawn
Chrome 137
- Utiliser une vue de texture pour la liaison externalTexture
- Copie des mémoires tampons sans spécifier de décalages ni de taille
- WGSL workgroupUniformLoad utilisant un pointeur vers atomic
- Attribut GPUAdapterInfo powerPreference
- Supprimer l'attribut GPURequestAdapterOptions compatibilityMode
- Mises à jour de Dawn
Chrome 136
- Attribut GPUAdapterInfo isFallbackAdapter
- Amélioration du temps de compilation des nuanceurs sur D3D12
- Enregistrer et copier des images de canevas
- Supprimer les restrictions du mode de compatibilité
- Mises à jour de Dawn
Chrome 135
- Autoriser la création d'une mise en page de pipeline avec une mise en page de groupe de liaisons nulle
- Autoriser les fenêtres d'affichage à s'étendre au-delà des limites des cibles de rendu
- Accès plus facile au mode de compatibilité expérimental sur Android
- Supprimer la limite maxInterStageShaderComponents
- Mises à jour de Dawn
Chrome 134
- Améliorer les charges de travail de machine learning avec des sous-groupes
- Supprimer la compatibilité avec les types de textures filtrables flottantes en tant que mélangeables
- Mises à jour de Dawn
Chrome 133
- Formats de sommets supplémentaires unorm8x4-bgra et à un composant
- Autoriser la demande de limites inconnues avec une valeur non définie
- Modifications des règles d'alignement WGSL
- Amélioration des performances WGSL avec discard
- Utiliser displaySize VideoFrame pour les textures externes
- Gérer les images avec des orientations non par défaut à l'aide de copyExternalImageToTexture
- Amélioration de l'expérience des développeurs
- Activer le mode de compatibilité avec featureLevel
- Nettoyage des fonctionnalités expérimentales de sous-groupes
- Abandon de la limite maxInterStageShaderComponents
- Mises à jour de Dawn
Chrome 132
- Utilisation de la vue de texture
- Mélange de textures flottantes 32 bits
- Attribut GPUDevice adapterInfo
- La configuration du contexte de canevas avec un format non valide génère une erreur JavaScript
- Restrictions de l'échantillonneur de filtrage sur les textures
- Expérimentation étendue des sous-groupes
- Amélioration de l'expérience des développeurs
- Compatibilité expérimentale avec les formats de texture normalisés 16 bits
- Mises à jour de Dawn
Chrome 131
- Découper les distances dans WGSL
- GPUCanvasContext getConfiguration()
- Les primitives de point et de ligne ne doivent pas avoir de biais de profondeur
- Fonctions intégrées d'analyse inclusive pour les sous-groupes
- Compatibilité expérimentale avec le dessin indirect multiple
- Option de compilation de module de nuanceur strict math
- Supprimer GPUAdapter requestAdapterInfo()
- Mises à jour de Dawn
Chrome 130
- Mélange à double source
- Amélioration du temps de compilation des nuanceurs sur Metal
- Abandon de GPUAdapter requestAdapterInfo()
- Mises à jour de Dawn
Chrome 129
- Compatibilité HDR avec le mode de mappage de tonalité du canevas
- Compatibilité étendue avec les sous-groupes
- Mises à jour de Dawn
Chrome 128
- Expérimentation avec des sous-groupes
- Abandon de la définition du biais de profondeur pour les lignes et les points
- Masquer l'avertissement des outils pour les développeurs d'erreur non capturée si preventDefault
- WGSL interpole l'échantillonnage en premier et l'un ou l'autre
- Mises à jour de Dawn
Chrome 127
- Compatibilité expérimentale avec OpenGL ES sur Android
- Attribut GPUAdapter info
- Amélioration de l'interopérabilité WebAssembly
- Amélioration des erreurs d'encodeur de commandes
- Mises à jour de Dawn
Chrome 126
- Augmenter la limite maxTextureArrayLayers
- Optimisation de l'importation de mémoire tampon pour le backend Vulkan
- Amélioration du temps de compilation des nuanceurs
- Les mémoires tampons de commandes envoyées doivent être uniques
- Mises à jour de Dawn
Chrome 125
- Sous-groupes (fonctionnalité en développement)
- Rendu sur une tranche de texture 3D
- Mises à jour de Dawn
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Compatibilité avec les service workers et les shared workers
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Mises à jour de Dawn
Chrome 123
- Compatibilité avec les fonctions intégrées DP4a dans WGSL
- Paramètres de pointeur non restreints dans WGSL
- Sucre syntaxique pour la déréférence des composites dans WGSL
- État en lecture seule distinct pour les aspects de pochoir et de profondeur
- Mises à jour de Dawn
Chrome 122
- Élargir la portée avec le mode de compatibilité (fonctionnalité en développement)
- Augmenter la limite maxVertexAttributes
- Mises à jour de Dawn
Chrome 121
- Compatibilité avec WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation de nuanceurs sur Windows
- Requêtes d'horodatage dans les passes de calcul et de rendu
- Points d'entrée par défaut pour les modules de nuanceurs
- Compatibilité avec display-p3 en tant qu'espace colorimétrique GPUExternalTexture
- Informations sur les tas de mémoire
- Mises à jour de Dawn
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repousser les limites
- Modifications de l'état de profondeur-pochoir
- Mises à jour des informations sur l'adaptateur
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures flottantes 32 bits filtrables
- Format de sommet unorm10-10-10-2
- Format de texture rgb10a2uint
- Mises à jour de Dawn
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture() - Compatibilité expérimentale avec la texture de stockage en lecture/écriture et en lecture seule
- Mises à jour de Dawn
Chrome 117
- Désactiver la mémoire tampon de sommets
- Désactiver le groupe de liaisons
- Masquer les erreurs de création de pipeline asynchrone lorsque l'appareil est perdu
- Mises à jour de la création de modules de nuanceurs SPIR-V
- Amélioration de l'expérience des développeurs
- Mise en cache des pipelines avec une mise en page générée automatiquement
- Mises à jour de Dawn
Chrome 116
- Intégration de WebCodecs
- Appareil perdu renvoyé par GPUAdapter
requestDevice() - Maintenir la fluidité de la lecture vidéo si
importExternalTexture()est appelé - Conformité aux spécifications
- Amélioration de l'expérience des développeurs
- Mises à jour de Dawn
Chrome 115
- Extensions de langage WGSL compatibles
- Compatibilité expérimentale avec Direct3D 11
- Obtenir le GPU discret par défaut sur l'alimentation secteur
- Amélioration de l'expérience des développeurs
- Mises à jour de Dawn
Chrome 114
- Optimiser JavaScript
- getCurrentTexture() sur un canevas non configuré génère InvalidStateError
- Mises à jour de WGSL
- Mises à jour de Dawn