Gepubliceerd: 26 februari 2025
Verbeter machine learning-workloads met subgroepen
Na een jaar van ontwikkeling en testen is de WebGPU-functie voor subgroepen, die parallellisme op SIMD-niveau mogelijk maakt, nu beschikbaar. Het stelt threads in een werkgroep in staat om te communiceren en collectieve wiskundige bewerkingen uit te voeren, zoals het berekenen van een som van getallen, en biedt een efficiënte methode voor het delen van gegevens tussen threads. Zie het oorspronkelijke voorstel en het chromestatus-artikel .
Ter referentie: Google Meet zag een snelheidstoename van 2,3-2,9 keer bij het vergelijken van subgroepen met gepakte gehele-getallenpuntproducten voor matrix-vectorvermenigvuldigingsshaders op sommige apparaten tijdens de oorspronkelijke proef .
Wanneer de functie "subgroups"
beschikbaar is in een GPUAdapter
, vraag dan een GPUDevice
met deze functie aan om ondersteuning voor subgroepen in WGSL te krijgen. Het is handig om de adapterinfowaarden subgroupMinSize
en subgroupMaxSize
te controleren, bijvoorbeeld als u een hardgecodeerd algoritme hebt dat een subgroep van een bepaalde grootte vereist.
U moet deze extensie ook expliciet inschakelen in uw WGSL-code met enable subgroups;
om toegang te krijgen tot de volgende ingebouwde waarden in zowel de compute- als fragment shader-fasen:
subgroup_invocation_id
: een ingebouwde waarde voor de index van de thread binnen de subgroep.subgroup_size
: een ingebouwde waarde voor toegang tot subgroepgrootte.
De talrijke ingebouwde subgroepfuncties (bijvoorbeeld subgroupAdd()
, subgroupBallot()
, subgroupBroadcast()
, subgroupShuffle()
) maken efficiënte communicatie en berekeningen tussen aanroepen binnen een subgroep mogelijk. Deze subgroepbewerkingen worden geclassificeerd als single-instruction multiple-thread (SIMT)-bewerkingen. Bovendien faciliteren de ingebouwde quadfuncties , die op een quad van aanroepen werken, de datacommunicatie binnen de quad.
U kunt f16-waarden gebruiken met subgroepen wanneer u een GPUDevice
aanvraagt met zowel de functies "shader-f16"
als "subgroups"
.
Het volgende voorbeeld is een goed startpunt voor het verkennen van subgroepen: het toont een shader die de ingebouwde functie subgroupExclusiveMul()
gebruikt om faculteiten te berekenen zonder dat er geheugen hoeft te worden gelezen of geschreven om tussenliggende resultaten te communiceren.
Verwijder float-filterbare textuurtypen die ondersteuning bieden als mengbaar
Nu het blenden van 32-bits float-texturen beschikbaar is met de functie "float32-blendable"
, is de onjuiste ondersteuning voor float-filterbare textuurtypen als blendbaar verwijderd. Zie probleem 364987733 .
Dawn-updates
Dawn vereist nu macOS 11 en iOS 14 en ondersteunt alleen Metal 2.3+. Zie probleem 381117827 .
De nieuwe GetWGSLLanguageFeatures()
-methode van wgpu::Instance
vervangt nu EnumerateWGSLLanguageFeatures()
. Zie probleem 368672124 .
De volgende bindingstypen hebben een Undefined
waarde en hun standaardwaarden in de bindingslayout zijn gewijzigd. Zie probleem 377820810 .
-
wgpu::BufferBindingType::Undefined
is nuUniform
-
wgpu::SamplerBindingType::Undefined
Filtering
nu -
wgpu::TextureSampleType::Undefined
is nuFloat
-
wgpu::StorageTextureAccess::Undefined
is nuWriteOnly
Dit behandelt slechts enkele van de belangrijkste hoogtepunten. Bekijk de volledige lijst met commits .
Wat is er nieuw in WebGPU
Een lijst met alles wat in de serie Wat is er nieuw in WebGPU is behandeld.
Chroom 140
- Apparaatverzoeken verbruiken adapter
- Afkorting voor het gebruik van textuur waar textuurweergave wordt gebruikt
- WGSL textureSampleLevel ondersteunt 1D-texturen
- Verouder het gebruik van bgra8unorm-alleen-lezen-opslagtextuur
- GPUAdapter isFallbackAdapter-kenmerk verwijderen
- Dawn-updates
Chroom 139
- 3D-textuurondersteuning voor gecomprimeerde BC- en ASTC-formaten
- Nieuwe functie 'kernfuncties en beperkingen'
- Origin-proefversie voor WebGPU-compatibiliteitsmodus
- Dawn-updates
Chroom 138
- Afkorting voor het gebruik van buffer als bindingsbron
- Wijzigingen in de groottevereisten voor buffers die bij het aanmaken in kaart zijn gebracht
- Architectuurrapport voor recente GPU's
- Verouder GPUAdapter isFallbackAdapter-kenmerk
- Dawn-updates
Chroom 137
- Gebruik textuurweergave voor externe textuurbinding
- Buffers kopiëren zonder offsets en grootte op te geven
- WGSL-werkgroepUniformLoad met behulp van een pointer naar atomaire
- GPUAdapterInfo powerPreference-kenmerk
- Verwijder GPURequestAdapterOptions compatibilityMode-kenmerk
- Dawn-updates
Chroom 136
- GPUAdapterInfo isFallbackAdapter-kenmerk
- Verbeteringen in de shadercompilatietijd op D3D12
- Canvasafbeeldingen opslaan en kopiëren
- Beperkingen voor de liftcompatibiliteitsmodus
- Dawn-updates
Chroom 135
- Toestaan om pijplijnlay-out te maken met een lay-out voor null-bindgroepen
- Laat viewports zich uitstrekken voorbij de grenzen van de renderdoelen
- Gemakkelijkere toegang tot de experimentele compatibiliteitsmodus op Android
- Verwijder maxInterStageShaderComponents-limiet
- Dawn-updates
Chroom 134
- Verbeter machine learning-workloads met subgroepen
- Verwijder float-filterbare textuurtypen die ondersteuning bieden als mengbaar
- Dawn-updates
Chroom 133
- Extra unorm8x4-bgra en 1-component vertex-formaten
- Toestaan dat onbekende limieten worden aangevraagd met een ongedefinieerde waarde
- Wijzigingen in de WGSL-uitlijningsregels
- WGSL-prestatiewinst met weggooien
- Gebruik VideoFrame displaySize voor externe texturen
- Verwerk afbeeldingen met niet-standaardoriëntaties met copyExternalImageToTexture
- Verbetering van de ontwikkelaarservaring
- Compatibiliteitsmodus inschakelen met featureLevel
- Opschonen van experimentele subgroepkenmerken
- Verouder maxInterStageShaderComponents-limiet
- Dawn-updates
Chroom 132
- Gebruik van textuurweergave
- 32-bits float-texturen mengen
- GPUDevice adapterInfo-kenmerk
- Het configureren van de canvascontext met een ongeldige indeling levert een JavaScript-fout op
- Filteren van samplerbeperkingen op texturen
- Uitgebreide subgroepsexperimenten
- Verbetering van de ontwikkelaarservaring
- Experimentele ondersteuning voor 16-bits genormaliseerde textuurformaten
- Dawn-updates
Chroom 131
- Clipafstanden in WGSL
- GPUCanvasContext getConfiguration()
- Punt- en lijnprimitieven mogen geen dieptebias hebben
- Inclusief ingebouwde scanfuncties voor subgroepen
- Experimentele ondersteuning voor multi-draw indirect
- Shadermodule-compilatieoptie strikte wiskunde
- GPUAdapter requestAdapterInfo() verwijderen
- Dawn-updates
Chroom 130
- Menging van dubbele bronnen
- Verbeteringen in de shadercompilatietijd op Metal
- Veroudering van GPUAdapter requestAdapterInfo()
- Dawn-updates
Chroom 129
Chroom 128
- Experimenteren met subgroepen
- Diepteafwijking voor lijnen en punten afschaffen
- Verberg niet-vastgelegde fout DevTools-waarschuwing als preventDefault
- WGSL interpoleert eerst de bemonstering en ofwel
- Dawn-updates
Chroom 127
- Experimentele ondersteuning voor OpenGL ES op Android
- GPUAdapter info-kenmerk
- Verbeteringen in WebAssembly-interoperabiliteit
- Verbeterde opdrachtencoderfouten
- Dawn-updates
Chroom 126
- Verhoog maxTextureArrayLayers-limiet
- Bufferuploadoptimalisatie voor Vulkan-backend
- Verbeteringen in de compilatietijd van shaders
- Ingediende opdrachtbuffers moeten uniek zijn
- Dawn-updates
Chroom 125
Chroom 124
- Alleen-lezen en lees-schrijf opslagtexturen
- Ondersteuning van servicemedewerkers en gedeelde werknemers
- Nieuwe adapterinformatie-attributen
- Bugfixes
- Dawn-updates
Chroom 123
- Ondersteuning voor ingebouwde DP4a-functies in WGSL
- Onbeperkte pointerparameters in WGSL
- Syntaxissuiker voor het derefereren van composieten in WGSL
- Afzonderlijke alleen-lezenstatus voor stencil- en diepteaspecten
- Dawn-updates
Chroom 122
- Vergroot het bereik met de compatibiliteitsmodus (functie in ontwikkeling)
- Verhoog de maxVertexAttributes-limiet
- Dawn-updates
Chroom 121
- Ondersteuning voor WebGPU op Android
- Gebruik DXC in plaats van FXC voor shadercompilatie op Windows
- Tijdstempelquery's in compute- en renderpassen
- Standaard toegangspunten tot shadermodules
- Ondersteuning display-p3 als GPUExternalTexture-kleurruimte
- Geheugenstapels info
- Dawn-updates
Chroom 120
- Ondersteuning voor 16-bits drijvende-kommawaarden in WGSL
- Verleg de grenzen
- Wijzigingen in de dieptestencilstatus
- Adapterinformatie-updates
- Kwantificering van tijdstempelquery's
- Voorjaarsschoonmaakfuncties
Chroom 119
- Filterbare 32-bits float-texturen
- unorm10-10-10-2 vertex-formaat
- rgb10a2uint textuurformaat
- Dawn-updates
Chroom 118
- HTMLImageElement en ImageData-ondersteuning in
copyExternalImageToTexture()
- Experimentele ondersteuning voor lees-schrijf- en alleen-lezen-opslagtextuur
- Dawn-updates
Chroom 117
- Vertexbuffer ongedaan maken
- Bindgroep ongedaan maken
- Fouten bij het maken van een asynchrone pijplijn uitschakelen wanneer het apparaat verloren gaat
- Updates voor het maken van SPIR-V shadermodules
- Verbetering van de ontwikkelaarservaring
- Caching-pipelines met automatisch gegenereerde lay-out
- Dawn-updates
Chroom 116
- WebCodecs-integratie
- Verloren apparaat geretourneerd door GPUAdapter
requestDevice()
- Zorg ervoor dat de videoweergave vloeiend blijft als
importExternalTexture()
wordt aangeroepen - Specificatieconformiteit
- Verbetering van de ontwikkelaarservaring
- Dawn-updates
Chroom 115
- Ondersteunde WGSL-taalextensies
- Experimentele ondersteuning voor Direct3D 11
- Standaard discrete GPU op netstroom
- Verbetering van de ontwikkelaarservaring
- Dawn-updates
Chroom 114
- JavaScript optimaliseren
- getCurrentTexture() op een niet-geconfigureerd canvas genereert InvalidStateError
- WGSL-updates
- Dawn-updates