Compatibilité avec les fonctions intégrées DP4a dans WGSL
DP4a (Dot Product of 4 Elements and Accumulate) fait référence à un ensemble d'instructions GPU couramment utilisées dans l'inférence de deep learning pour la quantification. Il effectue efficacement des produits scalaires entiers de 8 bits pour accélérer le calcul de ces modèles quantifiés int8. Il peut économiser jusqu'à 75 % de mémoire et de bande passante réseau, et améliorer les performances de tous les modèles de machine learning dans l'inférence par rapport à leur version f32. Par conséquent, il est désormais largement utilisé dans de nombreux frameworks d'IA populaires.
Lorsque l'extension de langage WGSL "packed_4x8_integer_dot_product" est présente dans navigator.gpu.wgslLanguageFeatures, vous pouvez désormais utiliser des scalaires entiers 32 bits contenant des vecteurs à quatre composants d'entiers 8 bits comme entrées pour les instructions de produit scalaire dans votre code de nuanceur WGSL avec les fonctions intégrées dot4U8Packed et dot4I8Packed. Vous pouvez également utiliser des instructions de compression et de décompression avec des vecteurs à quatre composants d'entiers 8 bits compressés avec les fonctions intégrées WGSL pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 et unpack4xU8.
Il est recommandé d'utiliser une directive requires pour signaler le potentiel de non-portabilité avec requires packed_4x8_integer_dot_product; en haut de votre code de nuanceur WGSL. Consultez l'exemple suivant et le problème tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Un grand merci à l'équipe Web Graphics d'Intel à Shanghai pour avoir mené à bien cette spécification et cette implémentation.
Paramètres de pointeur sans restriction dans WGSL
L'extension de langage WGSL "unrestricted_pointer_parameters" assouplit les restrictions sur les pointeurs qui peuvent être transmis aux fonctions WGSL :
Pointeurs de paramètres des espaces d'adressage
storage,uniformetworkgroupaux fonctions déclarées par l'utilisateur.Transmission de pointeurs aux membres de la structure et aux éléments du tableau aux fonctions déclarées par l'utilisateur.
Pour en savoir plus, consultez Pointers As Function Parameters | Tour of WGSL.
Cette fonctionnalité peut être détectée à l'aide de navigator.gpu.wgslLanguageFeatures. Il est recommandé d'utiliser une directive requires pour signaler le potentiel de non-portabilité avec requires unrestricted_pointer_parameters; en haut de votre code de nuanceur WGSL. Consultez l'exemple suivant, les modifications apportées à la spécification WGSL et le problème tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Sucre syntaxique pour la déréférenciation des composites dans WGSL
Lorsque l'extension de langage WGSL "pointer_composite_access" est présente dans navigator.gpu.wgslLanguageFeatures, votre code de nuanceur WGSL est désormais compatible avec l'accès aux composants de types de données complexes à l'aide de la même syntaxe de point (.), que vous travailliez directement avec les données ou avec un pointeur vers celles-ci. Voici comment cela fonctionne :
Si
fooest un pointeur,foo.barest un moyen plus pratique d'écrire(*foo).bar. L'astérisque (*) serait normalement nécessaire pour transformer le pointeur en "référence" qui peut être déréférencée, mais désormais, les pointeurs et les références sont beaucoup plus similaires et presque interchangeables.Si
foon'est pas un pointeur, l'opérateur point (.) fonctionne exactement comme vous en avez l'habitude pour accéder directement aux membres.
De même, si pa est un pointeur qui stocke l'adresse de début d'un tableau, l'utilisation de pa[i] vous donne un accès direct à l'emplacement de mémoire où est stocké le 'i'ième élément de ce tableau.
Il est recommandé d'utiliser une directive requires pour signaler le potentiel de non-portabilité avec requires pointer_composite_access; en haut de votre code de nuanceur WGSL. Consultez l'exemple suivant et le problème tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
État de lecture seule distinct pour les aspects de pochoir et de profondeur
Auparavant, les pièces jointes de pochoir de profondeur en lecture seule dans les passes de rendu nécessitaient que les deux aspects (profondeur et pochoir) soient en lecture seule. Cette limite a été supprimée. Vous pouvez désormais utiliser l'aspect de profondeur en lecture seule, par exemple pour le traçage des ombres de contact, tandis que le tampon de pochoir est écrit pour identifier les pixels à traiter ultérieurement. Consultez le problème dawn:2146.
Mises à jour de Dawn
Le rappel d'erreur non capturé défini avec wgpuDeviceSetUncapturedErrorCallback() est désormais appelé immédiatement lorsque l'erreur se produit. C'est ce que les développeurs attendent et souhaitent de manière cohérente pour le débogage. Consultez la modification dawn:173620.
La méthode wgpuSurfaceGetPreferredFormat() de l'API webgpu.h a été implémentée. Consultez le problème dawn:1362.
Cela ne couvre que quelques-uns des principaux points forts. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tous les sujets abordés dans la série Nouveautés de WebGPU.
Chrome 147-148
Chrome 146
- Compatibilité avec le mode de compatibilité WebGPU sur OpenGL ES 3.1
- Pièces jointes temporaires
- Extension texture_and_sampler_let WGSL
- Mises à jour de Dawn
Chrome 145
- Extension subgroup_uniformity WGSL
- Mappage de mémoire tampon synchrone expérimental dans les nœuds de calcul
- Mises à jour de Dawn
Chrome 144
- Extension subgroup_id WGSL
- Extension uniform_buffer_standard_layout WGSL
- WebGPU sur Linux
- Écriture plus rapide de writeBuffer et writeTexture
- Mises à jour de Dawn
Chrome 143
- Swizzle de composant de texture
- Suppression de l'utilisation de la texture de stockage en lecture seule bgra8unorm
- Mises à jour de Dawn
Chrome 142
- Extension des fonctionnalités de compatibilité avec le format de texture
- Index primitif dans WGSL
- Mises à jour de Dawn
Chrome 141
- IR de teinte terminée
- Analyse de la plage d'entiers dans le compilateur WGSL
- Mise à jour de SPIR-V 1.4 pour le backend Vulkan
- Mises à jour de Dawn
Chrome 140
- Les requêtes d'appareil consomment l'adaptateur
- Raccourci pour utiliser une texture lorsqu'une vue de texture est utilisée
- WGSL textureSampleLevel est compatible avec les textures 1D
- Abandon de l'utilisation de la texture de stockage en lecture seule bgra8unorm
- Suppression de l'attribut GPUAdapter isFallbackAdapter
- Mises à jour de Dawn
Chrome 139
- Compatibilité avec les textures 3D pour les formats compressés BC et ASTC
- Nouvelle fonctionnalité "core-features-and-limits"
- Phase d'évaluation pour le mode de compatibilité WebGPU
- Mises à jour de Dawn
Chrome 138
- Raccourci pour utiliser une mémoire tampon comme ressource de liaison
- Modifications des exigences de taille pour les mémoires tampons mappées lors de la création
- Rapport d'architecture pour les GPU récents
- Abandon de l'attribut GPUAdapter isFallbackAdapter
- Mises à jour de Dawn
Chrome 137
- Utilisation de la vue de texture pour la liaison externalTexture
- Copie des mémoires tampons sans spécifier de décalages ni de taille
- WGSL workgroupUniformLoad à l'aide d'un pointeur vers atomic
- Attribut GPUAdapterInfo powerPreference
- Suppression de l'attribut GPURequestAdapterOptions compatibilityMode
- Mises à jour de Dawn
Chrome 136
- Attribut GPUAdapterInfo isFallbackAdapter
- Améliorations du temps de compilation des nuanceurs sur D3D12
- Enregistrement et copie des images de canevas
- Suppression des restrictions du mode de compatibilité
- Mises à jour de Dawn
Chrome 135
- Autorisation de la création d'une mise en page de pipeline avec une mise en page de groupe de liaisons nulle
- Autorisation des fenêtres d'affichage au-delà des limites des cibles de rendu
- Accès plus facile au mode de compatibilité expérimental sur Android
- Suppression de la limite maxInterStageShaderComponents
- Mises à jour de Dawn
Chrome 134
- Amélioration des charges de travail de machine learning avec des sous-groupes
- Suppression de la compatibilité avec les types de textures filtrables flottantes en tant que mélangeables
- Mises à jour de Dawn
Chrome 133
- Formats de sommets unorm8x4-bgra et à un composant supplémentaires
- Autorisation de la demande de limites inconnues avec une valeur non définie
- Modifications des règles d'alignement WGSL
- Améliorations des performances WGSL avec discard
- Utilisation de displaySize VideoFrame pour les textures externes
- Gestion des images avec des orientations non par défaut à l'aide de copyExternalImageToTexture
- Amélioration de l'expérience des développeurs
- Activation du mode de compatibilité avec featureLevel
- Nettoyage des fonctionnalités expérimentales des sous-groupes
- Abandon de la limite maxInterStageShaderComponents
- Mises à jour de Dawn
Chrome 132
- Utilisation de la vue de texture
- Mélange de textures flottantes 32 bits
- Attribut GPUDevice adapterInfo
- La configuration du contexte de canevas avec un format non valide génère une erreur JavaScript
- Restrictions sur le filtreur pour les textures
- Expérimentation étendue des sous-groupes
- Amélioration de l'expérience des développeurs
- Compatibilité expérimentale avec les formats de texture normalisés 16 bits
- Mises à jour de Dawn
Chrome 131
- Distances de découpage dans WGSL
- GPUCanvasContext getConfiguration()
- Les primitives de point et de ligne ne doivent pas avoir de biais de profondeur
- Fonctions intégrées d'analyse inclusive pour les sous-groupes
- Compatibilité expérimentale avec le dessin indirect multiple
- Option de compilation de module de nuanceur strict math
- Suppression de GPUAdapter requestAdapterInfo()
- Mises à jour de Dawn
Chrome 130
- Mélange à double source
- Améliorations du temps de compilation des nuanceurs sur Metal
- Abandon de GPUAdapter requestAdapterInfo()
- Mises à jour de Dawn
Chrome 129
- Compatibilité HDR avec le mode de mappage de tonalité de canevas
- Compatibilité étendue avec les sous-groupes
- Mises à jour de Dawn
Chrome 128
- Expérimentation avec des sous-groupes
- Abandon de la définition du biais de profondeur pour les lignes et les points
- Masquage de l'avertissement d'erreur non capturée dans les outils de développement si preventDefault
- Échantillonnage d'interpolation WGSL en premier et l'un ou l'autre
- Mises à jour de Dawn
Chrome 127
- Compatibilité expérimentale avec OpenGL ES sur Android
- Attribut GPUAdapter info
- Améliorations de l'interopérabilité WebAssembly
- Amélioration des erreurs d'encodeur de commandes
- Mises à jour de Dawn
Chrome 126
- Augmentation de la limite maxTextureArrayLayers
- Optimisation de l'importation de mémoire tampon pour le backend Vulkan
- Améliorations du temps de compilation des nuanceurs
- Les mémoires tampons de commandes envoyées doivent être uniques
- Mises à jour de Dawn
Chrome 125
- Sous-groupes (fonctionnalité en développement)
- Rendu sur une tranche de texture 3D
- Mises à jour de Dawn
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Compatibilité avec les service workers et les shared workers
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Mises à jour de Dawn
Chrome 123
- Compatibilité avec les fonctions intégrées DP4a dans WGSL
- Paramètres de pointeur sans restriction dans WGSL
- Sucre syntaxique pour la déréférenciation des composites dans WGSL
- État de lecture seule distinct pour les aspects de pochoir et de profondeur
- Mises à jour de Dawn
Chrome 122
- Élargissement de la portée avec le mode de compatibilité (fonctionnalité en développement)
- Augmentation de la limite maxVertexAttributes
- Mises à jour de Dawn
Chrome 121
- Compatibilité avec WebGPU sur Android
- Utilisation de DXC au lieu de FXC pour la compilation de nuanceurs sous Windows
- Requêtes d'horodatage dans les passes de calcul et de rendu
- Points d'entrée par défaut pour les modules de nuanceurs
- Compatibilité avec display-p3 en tant qu'espace colorimétrique GPUExternalTexture
- Informations sur les tas de mémoire
- Mises à jour de Dawn
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repousser les limites
- Modifications de l'état de pochoir de profondeur
- Mises à jour des informations sur l'adaptateur
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures flottantes 32 bits filtrables
- Format de sommet unorm10-10-10-2
- Format de texture rgb10a2uint
- Mises à jour de Dawn
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture() - Compatibilité expérimentale avec la texture de stockage en lecture/écriture et en lecture seule
- Mises à jour de Dawn
Chrome 117
- Suppression de la mémoire tampon de sommets
- Suppression du groupe de liaisons
- Suppression des erreurs liées à la création de pipeline asynchrone lorsque l'appareil est perdu
- Mises à jour de la création de modules de nuanceurs SPIR-V
- Amélioration de l'expérience des développeurs
- Mise en cache des pipelines avec une mise en page générée automatiquement
- Mises à jour de Dawn
Chrome 116
- Intégration de WebCodecs
- Appareil perdu renvoyé par GPUAdapter
requestDevice() - Lecture vidéo fluide si
importExternalTexture()est appelé - Conformité aux spécifications
- Amélioration de l'expérience des développeurs
- Mises à jour de Dawn
Chrome 115
- Extensions de langage WGSL compatibles
- Compatibilité expérimentale avec Direct3D 11
- Obtention du GPU discret par défaut sur l'alimentation secteur
- Amélioration de l'expérience des développeurs
- Mises à jour de Dawn
Chrome 114
- Optimisation de JavaScript
- getCurrentTexture() sur un canevas non configuré génère InvalidStateError
- Mises à jour de WGSL
- Mises à jour de Dawn