WebGPU (Chrome→123) में नया क्या है

François Beaufort
François Beaufort

WGSL में DP4a के पहले से मौजूद फ़ंक्शन के साथ काम करना

DP4a (चार एलिमेंट और इकट्ठा करने का डॉट प्रॉडक्ट), जीपीयू निर्देशों के एक सेट को दिखाता है. आम तौर पर, इसे क्वांटाइज़ेशन के लिए डीप लर्निंग इंफ़रेंस में इस्तेमाल किया जाता है. यह 8-बिट इंटिजर डॉट प्रॉडक्ट को बेहतर तरीके से इस्तेमाल करता है, ताकि int8-क्वंटिज़ किए गए मॉडल का हिसाब तेज़ी से लगाया जा सके. इससे 75% तक मेमोरी और नेटवर्क बैंडविड्थ बच सकती है. साथ ही, f32 वर्शन की तुलना में, किसी भी मशीन लर्निंग मॉडल की अनुमान लगाने की परफ़ॉर्मेंस बेहतर हो सकती है. इस वजह से, अब इसका इस्तेमाल कई लोकप्रिय एआई फ़्रेमवर्क में ज़्यादा से ज़्यादा किया जा रहा है.

जब navigator.gpu.wgslLanguageFeatures में "packed_4x8_integer_dot_product" WGSL भाषा एक्सटेंशन मौजूद होता है, तो अब 8-बिट इंटिजर के चार-कॉम्पोनेंट वाले वैक्टर को पैक करने वाले 32-बिट इंटिजर स्केलर का इस्तेमाल किया जा सकता है. इन वैक्टर को, dot4U8Packed और dot4I8Packed के पहले से मौजूद फ़ंक्शन के साथ, अपने WGSL शेडर कोड में डॉट प्रॉडक्ट निर्देशों के इनपुट के तौर पर पैक किया जा सकता है. 8-बिट के पूर्णांकों के पैक किए गए चार-कॉम्पोनेंट वाले वैक्टर के साथ, पैकिंग और अनपैकिंग निर्देशों का इस्तेमाल भी किया जा सकता है. इसके लिए, pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8, और unpack4xU8 WGSL के इन-बिल्ट फ़ंक्शन का इस्तेमाल करें.

हमारा सुझाव है कि अपने WGSL शेडर कोड में सबसे ऊपर, requires packed_4x8_integer_dot_product; के साथ requires-directive का इस्तेमाल करें. इससे, कोड को पोर्ट न किए जाने की संभावना के बारे में पता चलता है. यहां दिया गया उदाहरण और issue tint:1497 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

इस स्पेसिफ़िकेशन को तैयार करने और उसे लागू करने के लिए, शंघाई में Intel की वेब ग्राफ़िक्स टीम का खास धन्यवाद!

WGSL में बिना पाबंदी वाले पॉइंटर पैरामीटर

"unrestricted_pointer_parameters" WGSL भाषा एक्सटेंशन, WGSL फ़ंक्शन में किन पॉइंटर को पास किया जा सकता है, इस पर लगी पाबंदियों को कम करता है:

  • storage, uniform, और workgroup के पैरामीटर पॉइंटर, उपयोगकर्ता के तय किए गए फ़ंक्शन के स्पेस को ऐड्रेस करते हैं.

  • उपयोगकर्ता के तय किए गए फ़ंक्शन में, स्ट्रक्चर के सदस्यों और ऐरे एलिमेंट के पॉइंटर पास करना.

इसके बारे में ज़्यादा जानने के लिए, फ़ंक्शन पैरामीटर के तौर पर पॉइंटर | WGSL टूर देखें.

navigator.gpu.wgslLanguageFeatures का इस्तेमाल करके, इस सुविधा का पता लगाया जा सकता है. हमारा सुझाव है कि अपने WGSL शेडर कोड में सबसे ऊपर requires unrestricted_pointer_parameters; के साथ, पोर्ट न किए जा सकने की संभावना का सिग्नल देने के लिए, हमेशा requires-directive का इस्तेमाल करें. नीचे दिया गया उदाहरण, WGSL स्पेसिफ़िकेशन में हुए बदलाव, और इश्यू टिन्ट:2053 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

WGSL में कंपोजिट को डीरेफ़रंस करने के लिए सिंटैक्स शुगर

जब navigator.gpu.wgslLanguageFeatures में "pointer_composite_access" WGSL भाषा एक्सटेंशन मौजूद होता है, तो आपका WGSL शेडर कोड अब एक ही बिंदु (.) सिंटैक्स का इस्तेमाल करके, जटिल डेटा टाइप के कॉम्पोनेंट को ऐक्सेस कर सकता है. भले ही, आप सीधे डेटा के साथ काम कर रहे हों या उसके पॉइंटर के साथ. यह इस तरह से काम करता है:

  • अगर foo एक पॉइंटर है, तो foo.bar (*foo).bar लिखने का ज़्यादा आसान तरीका है. आम तौर पर, पॉइंटर को "रेफ़रंस" में बदलने के लिए, तारे के निशान (*) की ज़रूरत होती है. इस रेफ़रंस को डीरेफ़रंस किया जा सकता है. हालांकि, अब पॉइंटर और रेफ़रंस, दोनों एक-दूसरे से काफ़ी मिलते-जुलते हैं और एक-दूसरे के साथ इस्तेमाल किए जा सकते हैं.

  • अगर foo कोई पॉइंटर नहीं है, तो बिंदु (.) ऑपरेटर ठीक उसी तरह काम करता है जिस तरह सदस्यों को सीधे ऐक्सेस करने के लिए किया जाता है.

इसी तरह, अगर pa एक पॉइंटर है, जो किसी ऐरे का शुरुआती पता सेव करता है, तो pa[i] का इस्तेमाल करके, उस मेमोरी लोकेशन को सीधे ऐक्सेस किया जा सकता है जहां उस ऐरे का 'iवां एलिमेंट सेव किया गया है.

हमारा सुझाव है कि अपने WGSL शेडर कोड में सबसे ऊपर, requires pointer_composite_access; के साथ requires-directive का इस्तेमाल करें. इससे, कोड को पोर्ट न किए जाने की संभावना के बारे में पता चलता है. यहां दिया गया उदाहरण और issue tint:2113 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

स्टेंसिल और डेप्थ के लिए, अलग-अलग रीड-ओनली स्टेटस

पहले, रेंडर पास में रीड-ओनली डेप्थ-स्टेंसिल अटैचमेंट के लिए, दोनों पहलुओं (डेप्थ और स्टेंसिल) को रीड-ओनली होना ज़रूरी था. इस पाबंदी को हटा दिया गया है. अब डेप्थ ऐस्पेक्ट का इस्तेमाल, रीड-ओनली मोड में किया जा सकता है. उदाहरण के लिए, संपर्क की छाया को ट्रैक करने के लिए. वहीं, स्टेंसिल बफ़र को आगे की प्रोसेसिंग के लिए पिक्सल की पहचान करने के लिए लिखा जाता है. issue dawn:2146 देखें.

Dawn के बारे में अपडेट

wgpuDeviceSetUncapturedErrorCallback() के साथ सेट किया गया, गड़बड़ी का कैप्चर नहीं किया गया कॉलबैक, अब गड़बड़ी होने पर तुरंत कॉल किया जाता है. डेवलपर, डीबग करने के लिए हमेशा यही चाहते हैं. change dawn:173620 देखें.

webgpu.h API का wgpuSurfaceGetPreferredFormat() तरीका लागू किया गया है. issue dawn:1362 देखें.

इसमें सिर्फ़ कुछ खास हाइलाइट शामिल हैं. कमिट की पूरी सूची देखें.

WebGPU में नया क्या है

WebGPU में नया क्या है सीरीज़ में शामिल सभी चीज़ों की सूची.

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113