Prise en charge des valeurs à virgule flottante 16 bits dans WGSL
Dans WGSL, le type f16
correspond à l'ensemble des valeurs à virgule flottante 16 bits du format IEEE-754 binary16 (demi-précision). Cela signifie qu'il utilise 16 bits pour représenter un nombre à virgule flottante, contre 32 bits pour la virgule flottante à simple précision conventionnelle (f32
). Cette taille plus petite peut entraîner des améliorations significatives des performances, en particulier lors du traitement de grandes quantités de données.
À titre de comparaison, sur un appareil Apple M1 Pro, l'implémentation f16
des modèles Llama2 7B utilisés dans la démonstration de chat WebLLM est nettement plus rapide que l'implémentation f32
, avec une amélioration de 28 % de la vitesse de préremplissage et de 41 % de la vitesse de décodage, comme le montrent les captures d'écran suivantes.

f32
(à gauche) et f16
(à droite).Tous les GPU ne sont pas compatibles avec les valeurs à virgule flottante 16 bits. Lorsque la fonctionnalité "shader-f16"
est disponible dans un GPUAdapter
, vous pouvez désormais demander un GPUDevice
avec cette fonctionnalité et créer un module de nuanceur WGSL qui tire parti du type à virgule flottante à demi-précision f16
. Ce type peut être utilisé dans le module de nuanceur WGSL uniquement si vous activez l'extension WGSL f16
avec enable f16;
. Sinon, createShaderModule() générera une erreur de validation. Consultez l'exemple minimal suivant et le problème dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
Il est possible de prendre en charge les types f16
et f32
dans le code du module de nuanceur WGSL avec un alias
en fonction de la prise en charge de la fonctionnalité "shader-f16"
, comme indiqué dans l'extrait suivant.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Repoussez vos limites
Le nombre maximal d'octets nécessaires pour contenir un échantillon (pixel ou sous-pixel) de données de sortie du pipeline de rendu, pour tous les rattachements de couleur, est de 32 octets par défaut. Il est désormais possible de demander jusqu'à 64 éléments en utilisant la limite maxColorAttachmentBytesPerSample
. Consultez l'exemple suivant et issue dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Les limites maxInterStageShaderVariables
et maxInterStageShaderComponents
utilisées pour la communication entre les étapes ont été augmentées sur toutes les plates-formes. Pour en savoir plus, consultez le problème dawn:1448.
Pour chaque étape du nuanceur, le nombre maximal d'entrées de mise en page du groupe de liaison dans une mise en page de pipeline qui sont des tampons de stockage est de 8 par défaut. Il est désormais possible de demander jusqu'à 10 éléments en utilisant la limite maxStorageBuffersPerShaderStage
. Consultez le problème dawn:2159.
Une nouvelle limite maxBindGroupsPlusVertexBuffers
a été ajoutée. Il s'agit du nombre maximal d'emplacements de groupes de liaison et de tampons de vertex utilisés simultanément, en comptant les emplacements vides en dessous de l'index le plus élevé. Sa valeur par défaut est 24. Consultez le problème dawn:1849.
Modifications apportées à l'état de profondeur et de stencil
Pour améliorer l'expérience des développeurs, les attributs d'état du stencil de profondeur depthWriteEnabled
et depthCompare
ne sont plus toujours obligatoires : depthWriteEnabled
n'est requis que pour les formats avec profondeur, et depthCompare
n'est pas requis pour les formats avec profondeur s'il n'est pas utilisé du tout. Consultez le problème dawn:2132.
Mises à jour des informations sur l'adaptateur
Les attributs d'informations d'adaptateur type
et backend
non standards sont désormais disponibles lors de l'appel de requestAdapterInfo() lorsque l'utilisateur a activé le flag "WebGPU Developer Features" (Fonctionnalités pour les développeurs WebGPU) sur chrome://flags/#enable-webgpu-developer-features
. La valeur type
peut être "discrete GPU", "integrated GPU", "CPU" ou "unknown". backend
peut être "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" ou "null". Consultez les problèmes dawn:2112 et dawn:2107.

Le paramètre de liste unmaskHints
facultatif de requestAdapterInfo() a été supprimé. Consultez le problème dawn:1427.
Quantification des requêtes d'horodatage
Les requêtes d'horodatage permettent aux applications de mesurer le temps d'exécution des commandes GPU avec une précision à la nanoseconde près. Toutefois, la spécification WebGPU rend les requêtes d'horodatage facultatives en raison des préoccupations liées aux attaques par temporisation. L'équipe Chrome estime que la quantification des requêtes d'horodatage constitue un bon compromis entre précision et sécurité, en réduisant la résolution à 100 microsecondes. Consultez le problème dawn:1800.
Dans Chrome, les utilisateurs peuvent désactiver la quantification des codes temporels en activant le flag "Fonctionnalités pour les développeurs WebGPU" sur chrome://flags/#enable-webgpu-developer-features
. Notez que cet indicateur seul n'active pas la fonctionnalité "timestamp-query"
. Son implémentation est encore expérimentale et nécessite donc l'indicateur "Unsafe WebGPU Support" (Prise en charge WebGPU non sécurisée) à l'adresse chrome://flags/#enable-unsafe-webgpu
.
Dans Dawn, un nouveau paramètre d'appareil appelé "timestamp_quantization" a été ajouté et est activé par défaut. L'extrait suivant montre comment autoriser la fonctionnalité expérimentale "timestamp-query" sans quantification du code temporel lors de la demande d'un appareil.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Fonctionnalités de nettoyage de printemps
La fonctionnalité expérimentale "timestamp-query-inside-passes" a été renommée "chromium-experimental-timestamp-query-inside-passes" pour indiquer clairement aux développeurs qu'elle est expérimentale et qu'elle n'est disponible que dans les navigateurs basés sur Chromium pour le moment. Consultez le problème dawn:1193.
La fonctionnalité expérimentale "pipeline-statistics-query", qui n'était que partiellement implémentée, a été supprimée, car elle n'est plus développée. Consultez le problème chromium:1177506.
Il ne s'agit que de quelques-uns des points clés. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tous les sujets abordés dans la série Nouveautés de WebGPU.
Chrome 140
- Les demandes d'appareils consomment l'adaptateur
- Raccourci pour utiliser une texture lorsqu'une vue de texture est utilisée
- WGSL textureSampleLevel prend en charge les textures 1D
- Abandon de l'utilisation de textures de stockage en lecture seule bgra8unorm
- Suppression de l'attribut GPUAdapter isFallbackAdapter
- Informations sur Dawn
Chrome 139
- Prise en charge des textures 3D pour les formats compressés BC et ASTC
- Nouvelle fonctionnalité "core-features-and-limits"
- Phase d'évaluation de l'origine pour le mode de compatibilité WebGPU
- Informations sur Dawn
Chrome 138
- Raccourci pour utiliser le tampon comme ressource de liaison
- Modifications des exigences de taille pour les tampons mappés lors de la création
- Rapport sur l'architecture des GPU récents
- Obsolescence de l'attribut GPUAdapter isFallbackAdapter
- Informations sur Dawn
Chrome 137
- Utiliser la vue de texture pour la liaison externalTexture
- Copier des tampons sans spécifier de décalages ni de taille
- WGSL workgroupUniformLoad utilisant un pointeur vers un atome
- Attribut powerPreference de GPUAdapterInfo
- Suppression de l'attribut compatibilityMode de GPURequestAdapterOptions
- Informations sur Dawn
Chrome 136
- Attribut GPUAdapterInfo isFallbackAdapter
- Améliorations du temps de compilation des nuanceurs sur D3D12
- Enregistrer et copier des images du canevas
- Restrictions du mode Compatibilité avec Lift
- Informations sur Dawn
Chrome 135
- Autoriser la création d'une mise en forme de pipeline avec une mise en forme de groupe de liaisons nulle
- Autoriser les fenêtres d'affichage à s'étendre au-delà des limites des cibles de rendu
- Accès plus facile au mode de compatibilité expérimental sur Android
- Supprimer la limite maxInterStageShaderComponents
- Informations sur Dawn
Chrome 134
- Améliorer les charges de travail de machine learning avec des sous-groupes
- Supprimer la prise en charge des types de textures filtrables flottantes en tant que textures mélangeables
- Informations sur Dawn
Chrome 133
- Formats de vertex unorm8x4-bgra et à un seul composant supplémentaires
- Autoriser les limites inconnues à être demandées avec une valeur indéfinie
- Modifications des règles d'alignement WGSL
- Gains de performances WGSL avec "discard"
- Utiliser displaySize VideoFrame pour les textures externes
- Gérer les images avec des orientations non définies par défaut à l'aide de copyExternalImageToTexture
- Améliorer l'expérience des développeurs
- Activer le mode Compatibilité avec featureLevel
- Nettoyage des fonctionnalités expérimentales de sous-groupes
- Abandon de la limite maxInterStageShaderComponents
- Informations sur Dawn
Chrome 132
- Utilisation de la vue Texture
- Mélange de textures flottantes 32 bits
- Attribut adapterInfo de GPUDevice
- La configuration du contexte du canevas avec un format non valide génère une erreur JavaScript
- Restrictions du filtreur d'échantillonneur sur les textures
- Tests étendus des sous-groupes
- Améliorer l'expérience des développeurs
- Prise en charge expérimentale des formats de texture normalisés 16 bits
- Informations sur Dawn
Chrome 131
- Distances de clipping dans WGSL
- GPUCanvasContext getConfiguration()
- Les primitives de points et de lignes ne doivent pas avoir de biais de profondeur
- Fonctions intégrées d'analyse inclusive pour les sous-groupes
- Compatibilité expérimentale avec le dessin indirect multiple
- Option de compilation du module de nuanceur "strict math"
- Suppression de GPUAdapter requestAdapterInfo()
- Informations sur Dawn
Chrome 130
- Combinaison de deux sources
- Amélioration du temps de compilation des nuanceurs sur Metal
- Obsolescence de GPUAdapter requestAdapterInfo()
- Informations sur Dawn
Chrome 129
- Compatibilité HDR avec le mode de mappage des tons du canevas
- Prise en charge étendue des sous-groupes
- Informations sur Dawn
Chrome 128
- Tester les sous-groupes
- Obsolète : définir le biais de profondeur pour les lignes et les points
- Masquer l'avertissement d'erreur non capturée dans les outils pour les développeurs si preventDefault
- WGSL interpolate sampling first and either
- Informations sur Dawn
Chrome 127
- Prise en charge expérimentale d'OpenGL ES sur Android
- Attribut info de GPUAdapter
- Améliorations de l'interopérabilité WebAssembly
- Amélioration des erreurs d'encodeur de commandes
- Informations sur Dawn
Chrome 126
- Augmenter la limite maxTextureArrayLayers
- Optimisation de l'importation de tampon pour le backend Vulkan
- Améliorations du temps de compilation des nuanceurs
- Les tampons de commandes envoyés doivent être uniques
- Informations sur Dawn
Chrome 125
- Sous-groupes (fonction en cours de développement)
- Afficher dans une tranche de texture 3D
- Informations sur Dawn
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Compatibilité avec les service workers et les shared workers
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Informations sur Dawn
Chrome 123
- Compatibilité des fonctions intégrées DP4a dans WGSL
- Paramètres de pointeur non restreints dans WGSL
- Sucre syntaxique pour la déréférence des composites dans WGSL
- État de lecture seule distinct pour les aspects de pochoir et de profondeur
- Informations sur Dawn
Chrome 122
- Élargir votre couverture avec le mode de compatibilité (fonctionnalité en cours de développement)
- Augmenter la limite maxVertexAttributes
- Informations sur Dawn
Chrome 121
- Assistance pour WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation des nuanceurs sur Windows
- Requêtes de code temporel dans les passes de calcul et de rendu
- Points d'entrée par défaut des modules de nuanceur
- Prise en charge de display-p3 en tant qu'espace colorimétrique GPUExternalTexture
- Informations sur les tas de mémoire
- Informations sur Dawn
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repousser les limites
- Modifications apportées à l'état de profondeur/stencil
- Mise à jour des informations sur l'adaptateur
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures flottantes de 32 bits filtrables
- Format de vertex unorm10-10-10-2
- Format de texture rgb10a2uint
- Informations sur Dawn
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture()
- Prise en charge expérimentale des textures de stockage en lecture/écriture et en lecture seule
- Informations sur Dawn
Chrome 117
- Désactiver le tampon de vertex
- Supprimer le groupe de liaisons
- Masquer les erreurs liées à la création de pipelines asynchrones lorsque l'appareil est perdu
- Modifications apportées à la création de modules de nuanceur SPIR-V
- Améliorer l'expérience des développeurs
- Pipelines de mise en cache avec mise en page générée automatiquement
- Informations sur Dawn
Chrome 116
- Intégration de WebCodecs
- Appareil égaré renvoyé par GPUAdapter
requestDevice()
- Lecture vidéo fluide si
importExternalTexture()
est appelé - Conformité des spécifications
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 115
- Extensions de langage WGSL acceptées
- Compatibilité expérimentale avec Direct3D 11
- Obtenir un GPU discret par défaut sur secteur
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 114
- Optimize JavaScript
- getCurrentTexture() sur un canevas non configuré génère une erreur InvalidStateError
- Mises à jour de WGSL
- Informations sur Dawn