Prise en charge des valeurs à virgule flottante 16 bits dans WGSL
Dans WGSL, le type f16
correspond à l'ensemble de valeurs 16 bits à virgule flottante au format IEEE-754 binary16 (demi-précision). Cela signifie qu'il utilise 16 bits pour représenter un nombre à virgule flottante, alors que 32 bits sont utilisés pour la méthode à virgule flottante classique à précision simple (f32
). Cette plus petite taille peut entraîner des améliorations significatives des performances, en particulier lors du traitement de grandes quantités de données.
À titre de comparaison, sur un appareil Apple M1 Pro, l'implémentation f16
des modèles Llama2 7B utilisés dans la démonstration du chat WebLLM est nettement plus rapide que l'implémentation f32
, avec une amélioration de 28% de la vitesse de préremplissage et de 41% de la vitesse de décodage, comme illustré dans les captures d'écran suivantes.
Tous les GPU ne sont pas compatibles avec les valeurs à virgule flottante 16 bits. Lorsque la fonctionnalité "shader-f16"
est disponible dans un GPUAdapter
, vous pouvez désormais demander un GPUDevice
avec cette fonctionnalité et créer un module de nuanceur WGSL qui exploite le type à virgule flottante à demi-précision f16
. Ce type ne peut être utilisé dans le module de nuanceur WGSL que si vous activez l'extension WGSL f16
avec enable f16;
. Sinon, createShaderModule() générera une erreur de validation. Consultez l'exemple minimal suivant et la description issue dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
Il est possible de prendre en charge les types f16
et f32
dans le code du module de nuanceur WGSL avec un alias
en fonction de la compatibilité de la fonctionnalité "shader-f16"
, comme indiqué dans l'extrait suivant.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Repoussez les limites
Par défaut, le nombre maximal d'octets nécessaires pour contenir un échantillon (pixel ou sous-pixel) de données de sortie du pipeline de rendu, pour toutes les pièces jointes de couleur, est de 32 octets. Il est désormais possible d'en demander jusqu'à 64 en utilisant la limite maxColorAttachmentBytesPerSample
. Consultez l'exemple et le problème dawn:2036 suivants.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Les limites de maxInterStageShaderVariables
et maxInterStageShaderComponents
utilisées pour la communication entre les étapes ont été augmentées sur toutes les plates-formes. Pour en savoir plus, consultez issue dawn:1448.
Pour chaque étape du nuanceur, le nombre maximal d'entrées de mise en page de groupe de liaisons dans une mise en page de pipeline qui sont des tampons de stockage est de huit par défaut. Vous pouvez désormais en demander jusqu'à 10 en utilisant la limite de maxStorageBuffersPerShaderStage
. Voir issue dawn:2159.
Une nouvelle limite de maxBindGroupsPlusVertexBuffers
a été ajoutée. Il s'agit du nombre maximal d'emplacements de groupe de liaisons et de tampon de sommets utilisés simultanément, en comptant les emplacements vides en dessous de l'index le plus élevé. Sa valeur par défaut est 24. Voir issue dawn:1849.
Modifications de l'état du pochoir de profondeur
Pour améliorer l'expérience des développeurs, les attributs d'état du pochoir de profondeur depthWriteEnabled
et depthCompare
ne sont plus obligatoires: depthWriteEnabled
n'est obligatoire que pour les formats avec de la profondeur, et depthCompare
n'est pas obligatoire pour les formats présentant de la profondeur, s'ils ne sont pas utilisés du tout. Voir issue dawn:2132.
Mises à jour des informations sur l'adaptateur
Les attributs d'informations d'adaptateur type
et backend
non standards sont désormais disponibles lors de l'appel de requestAdapterInfo() lorsque l'utilisateur a activé l'option "WebGPU Developer Features" (Fonctionnalités pour les développeurs WebGPU) sur chrome://flags/#enable-webgpu-developer-features
. Le type
peut être "GPU discret", "GPU intégré", "CPU" ou "inconnu". backend
est "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" ou "null". Voir issue dawn:2112 et issue dawn:2107.
Le paramètre de liste unmaskHints
facultatif dans requestAdapterInfo() a été supprimé. Voir issue dawn:1427.
Quantification des requêtes d'horodatage
Les requêtes d'horodatage permettent aux applications de mesurer le temps d'exécution de commandes GPU avec une précision à la nanoseconde près. Cependant, la spécification WebGPU rend les requêtes d'horodatage facultatives en raison des problèmes d'attaque liée au timing. L'équipe Chrome pense que la quantification des requêtes d'horodatage offre un bon compromis entre précision et sécurité, en réduisant la résolution à 100 microsecondes. Voir issue dawn:1800.
Dans Chrome, les utilisateurs peuvent désactiver la quantification du code temporel en activant l'indicateur "Fonctionnalités pour les développeurs WebGPU" sur chrome://flags/#enable-webgpu-developer-features
. Notez que cet indicateur seul n'active pas la fonctionnalité "timestamp-query"
. Son implémentation est encore expérimentale et nécessite donc l'indicateur "Assistance WebGPU non sécurisée" sur chrome://flags/#enable-unsafe-webgpu
.
Dans Dawn, un nouveau bouton d'activation/de désactivation de l'appareil appelé "timestamp_quantization" a été ajouté et est activé par défaut. L'extrait de code suivant vous montre comment autoriser la fonctionnalité expérimentale "timestamp-query" sans quantification d'horodatage lorsque vous demandez un appareil.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Fonctionnalités de nettoyage de printemps
La fonctionnalité expérimentale "timestamp-query-inside-passes" a été renommée "chromium-experimental-timestamp-query-inside-passes" pour indiquer clairement aux développeurs qu'elle est expérimentale et disponible uniquement dans les navigateurs basés sur Chromium pour le moment. Voir issue dawn:1193.
La fonctionnalité expérimentale "pipeline-statistics-query", qui n'a été que partiellement implémentée, a été supprimée, car elle n'est plus en cours de développement. Consultez problème chromium:1177506.
Nous n'aborderons ici que certains des points clés. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste des points abordés dans la série Nouveautés de WebGPU.
Chrome 125
- Sous-groupes (fonctionnalité en cours de développement)
- Effectuer le rendu sur une tranche de texture 3D
- Informations dès l'aube
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Assistance pour les service workers et les workers partagés
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Informations dès l'aube
Chrome 123
- Compatibilité des fonctions intégrées DP4a en WGSL
- Paramètres de pointeur non restreints dans WGSL
- Sucre syntaxique pour déréférencer des composites en WGSL
- État en lecture seule distinct pour les aspects du pochoir et de la profondeur
- Informations dès l'aube
Chrome 122
- Élargir la couverture grâce au mode de compatibilité (fonctionnalité en développement)
- Augmenter la limite maxVertexAttributes
- Informations dès l'aube
Chrome 121
- Prendre en charge WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation de nuanceurs sous Windows
- Horodatage des requêtes dans les passes de calcul et de rendu
- Points d'entrée par défaut des modules de nuanceurs
- Prendre en charge display-p3 en tant qu'espace colorimétrique GPUExternalTexture
- Informations sur les segments de mémoire
- Informations dès l'aube
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repoussez les limites
- Modifications de l'état du pochoir de profondeur
- Mises à jour des informations concernant l'adaptateur
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures flottantes 32 bits filtrables
- Format des sommets unorm10-10-10-2
- format de texture rgb10a2uint
- Informations dès l'aube
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture()
- Compatibilité expérimentale avec la texture de stockage en lecture/écriture et en lecture seule
- Informations dès l'aube
Chrome 117
- Tampon des sommets non défini
- Groupe de liaisons non défini
- Couper le son des erreurs lors de la création asynchrone d'un pipeline en cas de perte d'un appareil
- Mises à jour apportées à la création du module de nuanceur SPIR-V
- Améliorer l'expérience des développeurs
- Mettre en cache des pipelines avec une mise en page générée automatiquement
- Informations dès l'aube
Chrome 116
- Intégration de WebCodecs
- Appareil perdu renvoyé par GPUAdapter
requestDevice()
- Assurer une lecture vidéo fluide si
importExternalTexture()
est appelé - Conformité aux spécifications
- Améliorer l'expérience des développeurs
- Informations dès l'aube
Chrome 115
- Extensions de langage WGSL compatibles
- Compatibilité expérimentale avec Direct3D 11
- Utiliser un GPU distinct par défaut sur secteur
- Améliorer l'expérience des développeurs
- Informations dès l'aube
Chrome 114
- Optimiser JavaScript
- getCurrentTexture() sur un canevas non configuré génère une erreur InvalidStateError
- Mises à jour WGSL
- Informations dès l'aube