Prise en charge des valeurs à virgule flottante 16 bits dans WGSL
En WGSL, le type f16
est l'ensemble des valeurs à virgule flottante 16 bits du format binary16 (demi-précision) IEEE-754. Cela signifie qu'il utilise 16 bits pour représenter un nombre à virgule flottante, contre 32 bits pour les nombres à virgule flottante à précision simple conventionnels (f32
). Cette taille réduite peut entraîner des améliorations significatives des performances, en particulier lors du traitement de grandes quantités de données.
À titre de comparaison, sur un appareil Apple M1 Pro, l'implémentation f16
des modèles Llama2 7B utilisés dans la démo de chat WebLLM est nettement plus rapide que l'implémentation f32
, avec une amélioration de 28% de la vitesse de préremplissage et de 41% de la vitesse de décodage, comme illustré dans les captures d'écran suivantes.
Tous les GPU ne sont pas compatibles avec les valeurs à virgule flottante 16 bits. Lorsque la fonctionnalité "shader-f16"
est disponible dans un GPUAdapter
, vous pouvez désormais demander un GPUDevice
avec cette fonctionnalité et créer un module de nuanceur WGSL qui exploite le type à virgule flottante à demi-précision f16
. Ce type n'est valide dans le module de nuanceur WGSL que si vous activez l'extension WGSL f16
avec enable f16;
. Sinon, createShaderModule() génère une erreur de validation. Consultez l'exemple minimal suivant et l'problème dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
Il est possible de prendre en charge les types f16
et f32
dans le code du module de nuanceur WGSL avec un alias
, en fonction de la prise en charge de la fonctionnalité "shader-f16"
, comme indiqué dans l'extrait de code suivant.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Repoussez les limites
Par défaut, le nombre maximal d'octets nécessaire pour contenir un échantillon (pixel ou sous-pixel) de données de sortie du pipeline de rendu, pour tous les rattachements de couleur, est de 32 octets. Vous pouvez désormais en demander jusqu'à 64 à l'aide de la limite maxColorAttachmentBytesPerSample
. Consultez l'exemple suivant et issue dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Les limites maxInterStageShaderVariables
et maxInterStageShaderComponents
utilisées pour la communication entre les étapes ont été augmentées sur toutes les plates-formes. Pour en savoir plus, consultez le problème dawn:1448.
Pour chaque étape de nuanceur, le nombre maximal d'entrées de mise en page de groupe de liaison dans une mise en page de pipeline qui sont des tampons de stockage est de huit par défaut. Vous pouvez désormais en demander jusqu'à 10 à l'aide de la limite maxStorageBuffersPerShaderStage
. Voir le problème dawn:2159.
Une nouvelle limite maxBindGroupsPlusVertexBuffers
a été ajoutée. Il correspond au nombre maximal d'emplacements de groupe de liaison et de tampon de sommets utilisés simultanément, en comptant les emplacements vides situés en dessous de l'indice le plus élevé. Sa valeur par défaut est 24. Voir le problème dawn:1849.
Modifications apportées à l'état du tampon de profondeur
Pour améliorer l'expérience des développeurs, les attributs d'état du tampon de profondeur depthWriteEnabled
et depthCompare
ne sont plus toujours obligatoires: depthWriteEnabled
n'est obligatoire que pour les formats avec profondeur, et depthCompare
n'est pas obligatoire pour les formats avec profondeur s'ils ne sont pas utilisés du tout. Voir le problème dawn:2132.
Mises à jour des informations sur les adaptateurs
Les attributs d'informations d'adaptateur type
et backend
non standards sont désormais disponibles lors de l'appel de requestAdapterInfo() lorsque l'utilisateur a activé l'indicateur "Fonctionnalités de développement WebGPU" dans chrome://flags/#enable-webgpu-developer-features
. type
peut être "GPU discret", "GPU intégré", "CPU" ou "inconnu". backend
est "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" ou "null". Consultez les problèmes dawn:2112 et dawn:2107.
Le paramètre de liste unmaskHints
facultatif dans requestAdapterInfo() a été supprimé. Consultez le problème dawn:1427.
Quantification des requêtes d'horodatage
Les requêtes de code temporel permettent aux applications de mesurer le temps d'exécution des commandes GPU avec une précision à la nanoseconde près. Toutefois, la spécification WebGPU rend les requêtes de code temporel facultatives en raison des problèmes liés aux attaques par cassage de chiffrement. L'équipe Chrome estime que la quantification des requêtes de code temporel offre un bon compromis entre précision et sécurité, en réduisant la résolution à 100 microsecondes. Voir problème dawn:1800.
Dans Chrome, les utilisateurs peuvent désactiver la quantification des codes temporels en activant l'indicateur "WebGPU Developer Features" (Fonctionnalités de développement WebGPU) dans chrome://flags/#enable-webgpu-developer-features
. Notez que cet indicateur à lui seul n'active pas la fonctionnalité "timestamp-query"
. Son implémentation est encore expérimentale et nécessite donc l'option "Unsafe WebGPU Support" (Compatibilité avec WebGPU non sécurisé) dans chrome://flags/#enable-unsafe-webgpu
.
Dans Dawn, un nouvel boutons d'activation/de désactivation de l'appareil appelé "timestamp_quantization" a été ajouté et est activé par défaut. L'extrait de code suivant montre comment autoriser la fonctionnalité expérimentale "timestamp-query" sans quantification du code temporel lorsque vous demandez un appareil.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Fonctionnalités de nettoyage de printemps
La fonctionnalité expérimentale "timestamp-query-inside-passes" a été rebaptisée "chromium-experimental-timestamp-query-inside-passes" pour indiquer clairement aux développeurs qu'elle est expérimentale et qu'elle n'est disponible que dans les navigateurs basés sur Chromium pour le moment. Voir le problème dawn:1193.
La fonctionnalité expérimentale "pipeline-statistics-query", qui n'était implémentée qu'en partie, a été supprimée, car elle n'est plus en cours de développement. Consultez le problème chromium:1177506.
Il ne s'agit là que de quelques-uns des points clés. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tous les éléments abordés dans la série Nouveautés de WebGPU.
Chrome 131
- Couper les distances en WGSL
- GPUCanvasContext getConfiguration()
- Les primitives de point et de ligne ne doivent pas comporter de biais de profondeur.
- Fonctions intégrées d'analyse inclusive pour les sous-groupes
- Compatibilité expérimentale avec le multi-dessin indirect
- Option de compilation du module de nuanceur "math strict"
- Suppression de la méthode requestAdapterInfo() de GPUAdapter
- Informations sur Dawn
Chrome 130
- Mélange de deux sources
- Améliorations du temps de compilation des nuanceurs sur Metal
- Obsolete de la méthode requestAdapterInfo() de GPUAdapter
- Informations sur Dawn
Chrome 129
- Compatibilité HDR avec le mode de mappage des tons du canevas
- Prise en charge des sous-groupes étendus
- Informations sur Dawn
Chrome 128
- Tester les sous-groupes
- Abandon du paramètre de biais de profondeur pour les lignes et les points
- Masquer l'avertissement DevTools d'erreur non capturée si preventDefault
- WGSL effectue d'abord l'interpolation de l'échantillonnage, puis
- Informations sur Dawn
Chrome 127
- Compatibilité expérimentale d'OpenGL ES sur Android
- Attribut info de GPUAdapter
- Améliorations de l'interopérabilité WebAssembly
- Amélioration des erreurs de l'encodeur de commandes
- Informations sur Dawn
Chrome 126
- Augmentation de la limite maxTextureArrayLayers
- Optimisation de l'importation de tampons pour le backend Vulkan
- Améliorations du temps de compilation des nuanceurs
- Les tampons de commande envoyés doivent être uniques
- Informations sur Dawn
Chrome 125
- Sous-groupes (fonctionnalité en cours de développement)
- Affichage d'une tranche de texture 3D
- Informations sur Dawn
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Compatibilité avec les service workers et les workers partagés
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Informations sur Dawn
Chrome 123
- Compatibilité des fonctions intégrées DP4a avec WGSL
- Paramètres de pointeur non restreints dans WGSL
- Syntaxe simplifiée pour le déréférencement des composites en WGSL
- État en lecture seule distinct pour les aspects du pochoir et de la profondeur
- Informations sur Dawn
Chrome 122
- Élargir la couverture avec le mode de compatibilité (fonctionnalité en cours de développement)
- Augmentation de la limite maxVertexAttributes
- Informations sur Dawn
Chrome 121
- Compatibilité avec WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation de nuanceurs sous Windows
- Requêtes de code temporel dans les passes de calcul et de rendu
- Points d'entrée par défaut vers les modules de nuanceurs
- Compatibilité avec display-p3 en tant qu'espace de couleurs GPUExternalTexture
- Informations sur les tas de mémoire
- Informations sur Dawn
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repousser les limites
- Modifications apportées à l'état du tampon de profondeur
- Modifications des informations sur les adaptateurs
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures à virgule flottante 32 bits filtrables
- Format de sommet unorm10-10-10-2
- Format de texture rgb10a2uint
- Informations sur Dawn
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture()
- Compatibilité expérimentale avec la texture de stockage en lecture-écriture et en lecture seule
- Informations sur Dawn
Chrome 117
- Désactiver le tampon de sommets
- Désactiver le groupe de liaisons
- Ignorer les erreurs de création de pipeline asynchrone en cas de perte de l'appareil
- Mise à jour de la création de modules de nuanceurs SPIR-V
- Améliorer l'expérience des développeurs
- Mise en cache des pipelines avec une mise en page générée automatiquement
- Informations sur Dawn
Chrome 116
- Intégration de WebCodecs
- Appareil égaré renvoyé par GPUAdapter
requestDevice()
- Maintenir la fluidité de la lecture vidéo si
importExternalTexture()
est appelé - Conformité aux spécifications
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 115
- Extensions de langage WGSL acceptées
- Compatibilité expérimentale avec Direct3D 11
- Obtenir un GPU distinct par défaut sur l'alimentation secteur
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 114
- Optimiser JavaScript
- getCurrentTexture() sur un canevas non configuré génère une erreur InvalidStateError
- Mises à jour de WGSL
- Informations sur Dawn