Prise en charge des fonctions intégrées DP4a dans WGSL
DP4a (Dot Product of 4 Elements and Accumulate) fait référence à un ensemble d'instructions GPU couramment utilisées dans l'inférence de deep learning pour la quantification. Il effectue efficacement des produits scalaires d'entiers de 8 bits pour accélérer le calcul de ces modèles quantifiés int8. Il peut économiser jusqu'à 75 % de mémoire et de bande passante réseau, et améliorer les performances de tous les modèles de machine learning lors de l'inférence par rapport à leur version f32. Par conséquent, il est désormais largement utilisé dans de nombreux frameworks d'IA populaires.
Lorsque l'extension de langage "packed_4x8_integer_dot_product"
WGSL est présente dans navigator.gpu.wgslLanguageFeatures
, vous pouvez désormais utiliser des scalaires entiers 32 bits qui regroupent des vecteurs à quatre composants d'entiers 8 bits comme entrées pour les instructions de produit scalaire dans votre code de nuanceur WGSL avec les fonctions intégrées dot4U8Packed
et dot4I8Packed
. Vous pouvez également utiliser des instructions d'emballage et de déballage avec des vecteurs de quatre composants d'entiers de huit bits avec les fonctions intégrées WGSL pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
et unpack4xU8
.
Il est recommandé d'utiliser une directive "requires" pour signaler le risque de non-portabilité avec requires packed_4x8_integer_dot_product;
en haut de votre code de nuanceur WGSL. Consultez l'exemple suivant et issue tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Un grand merci à l'équipe Web Graphics d'Intel à Shanghai pour avoir mené à bien cette spécification et son implémentation !
Paramètres de pointeur non restreints dans WGSL
L'extension de langage "unrestricted_pointer_parameters"
WGSL assouplit les restrictions sur les pointeurs pouvant être transmis aux fonctions WGSL :
Les pointeurs de paramètres des espaces d'adressage
storage
,uniform
etworkgroup
aux fonctions déclarées par l'utilisateur.Transmettre des pointeurs aux membres de la structure et aux éléments du tableau aux fonctions déclarées par l'utilisateur.
Pour en savoir plus, consultez Pointers As Function Parameters | Tour of WGSL (Pointeurs en tant que paramètres de fonction | Visite guidée de WGSL).
Cette fonctionnalité peut être détectée à l'aide de navigator.gpu.wgslLanguageFeatures
. Il est recommandé d'utiliser systématiquement une directive requires pour signaler le risque de non-portabilité avec requires unrestricted_pointer_parameters;
en haut de votre code de nuanceur WGSL. Consultez l'exemple suivant, les modifications apportées à la spécification WGSL et le problème tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Sucre syntaxique pour la déréférence des composites dans WGSL
Lorsque l'extension de langage "pointer_composite_access"
WGSL est présente dans navigator.gpu.wgslLanguageFeatures
, votre code de nuanceur WGSL permet désormais d'accéder aux composants de types de données complexes à l'aide de la même syntaxe de point (.
), que vous travailliez directement avec les données ou avec un pointeur vers celles-ci. Voici comment cela fonctionne :
Si
foo
est un pointeur,foo.bar
est une façon plus pratique d'écrire(*foo).bar
. L'astérisque (*
) était normalement nécessaire pour transformer le pointeur en "référence" qui peut être déréférencée, mais maintenant, les pointeurs et les références sont beaucoup plus similaires et presque interchangeables.Si
foo
n'est pas un pointeur : l'opérateur point (.
) fonctionne exactement comme vous en avez l'habitude pour accéder directement aux membres.
De même, si pa
est un pointeur qui stocke l'adresse de départ d'un tableau, l'utilisation de pa[i]
vous donne un accès direct à l'emplacement de mémoire où est stocké le 'i
-ième élément de ce tableau.
Il est recommandé d'utiliser une directive "requires" pour signaler le risque de non-portabilité avec requires pointer_composite_access;
en haut de votre code de nuanceur WGSL. Consultez l'exemple suivant et le problème tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
État de lecture seule distinct pour les aspects de pochoir et de profondeur
Auparavant, les pièces jointes profondeur/stencil en lecture seule dans les passes de rendu nécessitaient que les deux aspects (profondeur et stencil) soient en lecture seule. Cette limite a été levée. Vous pouvez désormais utiliser l'aspect de profondeur en lecture seule, par exemple pour le traçage des ombres de contact, tandis que le tampon de stencil est écrit pour identifier les pixels à traiter ultérieurement. Consultez le problème dawn:2146.
Mises à jour de l'Aube
Le rappel d'erreur non capturée défini avec wgpuDeviceSetUncapturedErrorCallback()
est désormais appelé immédiatement lorsque l'erreur se produit. C'est ce que les développeurs attendent et souhaitent systématiquement pour le débogage. Voir change dawn:173620.
La méthode wgpuSurfaceGetPreferredFormat()
de l'API webgpu.h a été implémentée. Consultez le problème dawn:1362.
Il ne s'agit que de quelques-uns des points clés. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tous les sujets abordés dans la série Nouveautés de WebGPU.
Chrome 140
- Les demandes d'appareils consomment l'adaptateur
- Raccourci pour utiliser une texture lorsqu'une vue de texture est utilisée
- WGSL textureSampleLevel prend en charge les textures 1D
- Abandon de l'utilisation de textures de stockage en lecture seule bgra8unorm
- Suppression de l'attribut GPUAdapter isFallbackAdapter
- Informations sur Dawn
Chrome 139
- Prise en charge des textures 3D pour les formats compressés BC et ASTC
- Nouvelle fonctionnalité "core-features-and-limits"
- Phase d'évaluation de l'origine pour le mode de compatibilité WebGPU
- Informations sur Dawn
Chrome 138
- Raccourci pour utiliser le tampon comme ressource de liaison
- Modifications des exigences de taille pour les tampons mappés lors de la création
- Rapport sur l'architecture des GPU récents
- Obsolescence de l'attribut GPUAdapter isFallbackAdapter
- Informations sur Dawn
Chrome 137
- Utiliser la vue de texture pour la liaison externalTexture
- Copier des tampons sans spécifier de décalages ni de taille
- WGSL workgroupUniformLoad utilisant un pointeur vers un atome
- Attribut powerPreference de GPUAdapterInfo
- Suppression de l'attribut compatibilityMode de GPURequestAdapterOptions
- Informations sur Dawn
Chrome 136
- Attribut GPUAdapterInfo isFallbackAdapter
- Améliorations du temps de compilation des nuanceurs sur D3D12
- Enregistrer et copier des images du canevas
- Restrictions du mode Compatibilité avec Lift
- Informations sur Dawn
Chrome 135
- Autoriser la création d'une mise en forme de pipeline avec une mise en forme de groupe de liaisons nulle
- Autoriser les fenêtres d'affichage à s'étendre au-delà des limites des cibles de rendu
- Accès plus facile au mode de compatibilité expérimental sur Android
- Supprimer la limite maxInterStageShaderComponents
- Informations sur Dawn
Chrome 134
- Améliorer les charges de travail de machine learning avec des sous-groupes
- Supprimer la prise en charge des types de textures filtrables flottantes en tant que textures mélangeables
- Informations sur Dawn
Chrome 133
- Formats de vertex unorm8x4-bgra et à un seul composant supplémentaires
- Autoriser les limites inconnues à être demandées avec une valeur indéfinie
- Modifications des règles d'alignement WGSL
- Gains de performances WGSL avec "discard"
- Utiliser displaySize VideoFrame pour les textures externes
- Gérer les images avec des orientations non définies par défaut à l'aide de copyExternalImageToTexture
- Améliorer l'expérience des développeurs
- Activer le mode Compatibilité avec featureLevel
- Nettoyage des fonctionnalités expérimentales de sous-groupes
- Abandon de la limite maxInterStageShaderComponents
- Informations sur Dawn
Chrome 132
- Utilisation de la vue Texture
- Mélange de textures flottantes 32 bits
- Attribut adapterInfo de GPUDevice
- La configuration du contexte du canevas avec un format non valide génère une erreur JavaScript
- Restrictions du filtreur d'échantillonneur sur les textures
- Tests étendus des sous-groupes
- Améliorer l'expérience des développeurs
- Prise en charge expérimentale des formats de texture normalisés 16 bits
- Informations sur Dawn
Chrome 131
- Distances de clipping dans WGSL
- GPUCanvasContext getConfiguration()
- Les primitives de points et de lignes ne doivent pas avoir de biais de profondeur
- Fonctions intégrées d'analyse inclusive pour les sous-groupes
- Compatibilité expérimentale avec le dessin indirect multiple
- Option de compilation du module de nuanceur "strict math"
- Suppression de GPUAdapter requestAdapterInfo()
- Informations sur Dawn
Chrome 130
- Combinaison de deux sources
- Amélioration du temps de compilation des nuanceurs sur Metal
- Obsolescence de GPUAdapter requestAdapterInfo()
- Informations sur Dawn
Chrome 129
- Compatibilité HDR avec le mode de mappage des tons du canevas
- Prise en charge étendue des sous-groupes
- Informations sur Dawn
Chrome 128
- Tester les sous-groupes
- Obsolète : définir le biais de profondeur pour les lignes et les points
- Masquer l'avertissement d'erreur non capturée dans les outils pour les développeurs si preventDefault
- WGSL interpolate sampling first and either
- Informations sur Dawn
Chrome 127
- Prise en charge expérimentale d'OpenGL ES sur Android
- Attribut info de GPUAdapter
- Améliorations de l'interopérabilité WebAssembly
- Amélioration des erreurs d'encodeur de commandes
- Informations sur Dawn
Chrome 126
- Augmenter la limite maxTextureArrayLayers
- Optimisation de l'importation de tampon pour le backend Vulkan
- Améliorations du temps de compilation des nuanceurs
- Les tampons de commandes envoyés doivent être uniques
- Informations sur Dawn
Chrome 125
- Sous-groupes (fonction en cours de développement)
- Afficher dans une tranche de texture 3D
- Informations sur Dawn
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Compatibilité avec les service workers et les shared workers
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Informations sur Dawn
Chrome 123
- Compatibilité des fonctions intégrées DP4a dans WGSL
- Paramètres de pointeur non restreints dans WGSL
- Sucre syntaxique pour la déréférence des composites dans WGSL
- État de lecture seule distinct pour les aspects de pochoir et de profondeur
- Informations sur Dawn
Chrome 122
- Élargir votre couverture avec le mode de compatibilité (fonctionnalité en cours de développement)
- Augmenter la limite maxVertexAttributes
- Informations sur Dawn
Chrome 121
- Assistance pour WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation des nuanceurs sur Windows
- Requêtes de code temporel dans les passes de calcul et de rendu
- Points d'entrée par défaut des modules de nuanceur
- Prise en charge de display-p3 en tant qu'espace colorimétrique GPUExternalTexture
- Informations sur les tas de mémoire
- Informations sur Dawn
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repousser les limites
- Modifications apportées à l'état de profondeur/stencil
- Mise à jour des informations sur l'adaptateur
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures flottantes de 32 bits filtrables
- Format de vertex unorm10-10-10-2
- Format de texture rgb10a2uint
- Informations sur Dawn
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture()
- Prise en charge expérimentale des textures de stockage en lecture/écriture et en lecture seule
- Informations sur Dawn
Chrome 117
- Désactiver le tampon de vertex
- Supprimer le groupe de liaisons
- Masquer les erreurs liées à la création de pipelines asynchrones lorsque l'appareil est perdu
- Modifications apportées à la création de modules de nuanceur SPIR-V
- Améliorer l'expérience des développeurs
- Pipelines de mise en cache avec mise en page générée automatiquement
- Informations sur Dawn
Chrome 116
- Intégration de WebCodecs
- Appareil égaré renvoyé par GPUAdapter
requestDevice()
- Lecture vidéo fluide si
importExternalTexture()
est appelé - Conformité des spécifications
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 115
- Extensions de langage WGSL acceptées
- Compatibilité expérimentale avec Direct3D 11
- Obtenir un GPU discret par défaut sur secteur
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 114
- Optimize JavaScript
- getCurrentTexture() sur un canevas non configuré génère une erreur InvalidStateError
- Mises à jour de WGSL
- Informations sur Dawn