Nouveautés de WebGPU (Chrome 128)

François Beaufort
François Beaufort

Tester des sous-groupes

La fonctionnalité de sous-groupes permet le parallélisme au niveau SIMD, ce qui permet aux threads d'un groupe de communiquer et d'effectuer des opérations mathématiques collectives (par exemple, calculer la somme de 16 nombres). Cela permet de partager des données entre les threads de manière très efficace.

Une implémentation minimale de la proposition de sous-groupes est disponible pour les tests locaux derrière le flag "Unsafe WebGPU Support" (Prise en charge WebGPU non sécurisée) sur chrome://flags/#enable-unsafe-webgpu.

Vous pouvez également essayer les sous-groupes sur votre site avec de vrais utilisateurs en vous inscrivant à l'Origin Trial. Pour savoir comment préparer votre site à utiliser les versions d'essai des fonctionnalités, consultez Premiers pas avec les versions d'essai des fonctionnalités. L'évaluation de l'origine se déroulera de Chrome 128 à Chrome 131 (jusqu'au 19 février 2025). Consultez Intention de tester.

Lorsque la fonctionnalité "subgroups" est disponible dans un GPUAdapter, demandez un GPUDevice avec cette fonctionnalité pour obtenir la prise en charge des sous-groupes dans WGSL et vérifiez ses limites minSubgroupSize et maxSubgroupSize.

Vous devez également activer explicitement cette extension dans votre code WGSL avec enable subgroups;. Si vous l'activez, vous aurez accès aux ajouts suivants :

  • subgroup_invocation_id : valeur intégrée pour l'index du thread dans le sous-groupe.
  • subgroup_size : valeur intégrée pour l'accès à la taille du sous-groupe.
  • subgroupBallot(value) : renvoie un ensemble de champs de bits où le bit correspondant à subgroup_invocation_id est défini sur 1 si value est défini sur "true" pour cette invocation active, et sur 0 dans le cas contraire.
  • subgroupBroadcast(value, id) : diffuse le value de l'appel avec subgroup_invocation_id correspondant à id à tous les appels du sous-groupe. Remarque : id doit être une constante de temps de compilation.

D'autres fonctions intégrées, telles que subgroupAdd, subgroupAll, subgroupElect et subgroupShuffle, seront ajoutées à l'avenir. Consultez le problème 354738715.

Pour autoriser f16 dans les opérations de sous-groupes, demandez un GPUDevice avec les fonctionnalités "subgroups", "subgroups-f16" et "shader-f16", puis activez-le dans votre code WGSL avec enable f16, subgroups, subgroups_f16;.

L'extrait de code suivant fournit une base pour expérimenter et découvrir le potentiel des sous-groupes.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

Abandon du paramètre de biais de profondeur pour les lignes et les points

Une modification de la spécification WebGPU fait que la définition de depthBias, depthBiasSlopeScale et depthBiasClamp sur une valeur non nulle constitue une erreur de validation lorsque la topologie d'un pipeline de rendu est de type ligne ou point. Pour donner aux développeurs suffisamment de temps pour mettre à jour leur code, un avertissement s'affiche dans la console des outils de développement concernant cette prochaine validation, tout en forçant les valeurs à 0 dans ces circonstances. Consultez le problème 352567424.

Masquer l'avertissement d'erreur non capturée des outils de développement si preventDefault

Dans la console d'outils de développement, les avertissements concernant les événements uncapturederror ne s'affichent plus si un écouteur d'événements pour uncapturederror a été enregistré et que la méthode preventDefault() de l'événement a été appelée dans le rappel de l'écouteur d'événements. Ce comportement correspond à la gestion des événements en JavaScript. Consultez l'exemple suivant et le problème 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

WGSL interpolate sampling first and either

L'attribut WGSL interpolate vous permet de gérer l'interpolation des données d'E/S définies par l'utilisateur. Désormais, les nouveaux paramètres d'échantillonnage d'interpolation first (par défaut) et either vous offrent un contrôle supplémentaire : first utilise la valeur du premier sommet de la primitive, tandis que either autorise le premier ou le dernier sommet. Consultez le problème 340278447.

Mises à jour de l'Aube

L'implémentation de WGPUFuture de Dawn pour gérer les opérations asynchrones est désormais terminée. Les concepts clés incluent wgpuInstanceProcessEvents pour le traitement opportuniste des événements et WGPUCallbackMode pour définir les emplacements des rappels. WGPUFuture désigne des événements ponctuels avec une durée de vie infinie, et wgpuInstanceWaitAny attend la fin d'un futur ou un délai d'attente. Consultez le problème 42240932.

La valeur CompositeAlphaMode::Auto n'est plus signalée par Surface::GetCapabilities(). Il est toujours valide et équivaut à Surface::GetCapabilities().alphaMode[0]. Consultez le problème 292.

Le backend OpenGL est désormais compatible avec Surface avec un blit d'inversion Y pour chaque appel Present(). Consultez le problème 344814083.

La méthode Adapter::GetProperties() est obsolète. Utilisez plutôt Adapter::GetInfo().

Jaswant, un contributeur externe, a réécrit tous les fichiers CMake, ce qui les rend plus faciles à mettre à jour et permet les pré-compilations. Consultez le guide de démarrage rapide pour utiliser Dawn dans les projets CMake.

Il ne s'agit que de quelques-uns des points clés. Consultez la liste exhaustive des commits.

Nouveautés de WebGPU

Liste de tous les sujets abordés dans la série Nouveautés de WebGPU.

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113