WebGPU (Chrome 134) में नया क्या है

François Beaufort
François Beaufort

पब्लिश करने की तारीख: 26 फ़रवरी, 2025

सबग्रुप की मदद से, मशीन लर्निंग के वर्कलोड को बेहतर बनाना

एक साल के डेवलपमेंट और ट्रायल के बाद, WebGPU की सबग्रुप सुविधा अब उपलब्ध है. यह सुविधा, SIMD-लेवल के पैरललिज़्म को चालू करती है. इसकी मदद से, वर्कग्रुप में थ्रेड एक-दूसरे से कम्यूनिकेट कर सकती हैं. साथ ही, गणित से जुड़े कई ऑपरेशन एक साथ किए जा सकते हैं. जैसे, संख्याओं का योग निकालना. यह एक थ्रेड से दूसरी थ्रेड में डेटा शेयर करने का बेहतर तरीका भी उपलब्ध कराता है. मूल प्रस्ताव और chromestatus एंट्री देखें.

उदाहरण के लिए, ऑरिजिन ट्रायल के दौरान, कुछ डिवाइसों पर मैट्रिक्स-वेक्टर मल्टिप्लाई शेडर के लिए, पैक किए गए पूर्णांक डॉट प्रॉडक्ट के मुकाबले सबग्रुप की बेंचमार्किंग करते समय, Google Meet की स्पीड में 2.3 से 2.9 गुना की बढ़ोतरी देखी गई.

जब "subgroups" सुविधा GPUAdapter में उपलब्ध हो, तब इस सुविधा के साथ GPUDevice का अनुरोध करें, ताकि WGSL में सबग्रुप की सुविधा मिल सके. subgroupMinSize और subgroupMaxSize अडैप्टर की जानकारी की वैल्यू की जांच करना मददगार होता है. उदाहरण के लिए, अगर आपके पास हार्डकोड किया गया कोई ऐसा एल्गोरिदम है जिसके लिए किसी खास साइज़ के सबग्रुप की ज़रूरत होती है.

आपको अपने WGSL कोड में इस एक्सटेंशन को साफ़ तौर पर चालू करना होगा. इसके लिए, enable subgroups; का इस्तेमाल करें. इससे आपको कंप्यूट और फ़्रैगमेंट शेडर, दोनों चरणों में इन बिल्ट-इन वैल्यू को ऐक्सेस करने की सुविधा मिलेगी:

  • subgroup_invocation_id: यह सबग्रुप में थ्रेड के इंडेक्स के लिए, पहले से मौजूद वैल्यू होती है.

  • subgroup_size: सबग्रुप के साइज़ के ऐक्सेस के लिए, पहले से मौजूद वैल्यू.

सबग्रुप में शामिल कई बिल्ट-इन फ़ंक्शन (जैसे, subgroupAdd(), subgroupBallot(), subgroupBroadcast(), subgroupShuffle()) की मदद से, सबग्रुप में शामिल इनवॉकेशन के बीच आसानी से कम्यूनिकेट किया जा सकता है और हिसाब लगाया जा सकता है. इन सबग्रुप ऑपरेशन को सिंगल-इंस्ट्रक्शन मल्टीपल-थ्रेड (एसआईएमटी) ऑपरेशन के तौर पर क्लासिफ़ाई किया जाता है. इसके अलावा, क्वाड में शामिल बिल्ट-इन फ़ंक्शन, क्वाड के इनवोकेशन पर काम करते हैं. इससे क्वाड में डेटा कम्यूनिकेशन को आसान बनाने में मदद मिलती है.

"shader-f16" और "subgroups", दोनों सुविधाओं के साथ GPUDevice का अनुरोध करते समय, सबग्रुप के साथ f16 वैल्यू का इस्तेमाल किया जा सकता है.

उपसमूहों के बारे में जानने के लिए, यहां दिया गया सैंपल एक अच्छा शुरुआती पॉइंट है: इसमें एक ऐसा शेडर दिखाया गया है जो फ़ैक्टोरियल का हिसाब लगाने के लिए, subgroupExclusiveMul() बिल्ट-इन फ़ंक्शन का इस्तेमाल करता है. इसके लिए, यह इंटरमीडिएट नतीजों को कम्यूनिकेट करने के लिए मेमोरी को न तो पढ़ता है और न ही लिखता है.

फ़्लोट फ़िल्टर किए जा सकने वाले टेक्सचर टाइप को ब्लेंड किए जा सकने वाले टाइप के तौर पर इस्तेमाल करने की सुविधा हटा दी गई है

"float32-blendable" सुविधा के साथ 32-बिट फ़्लोट टेक्सचर ब्लेंडिंग उपलब्ध होने के बाद, फ़्लोट फ़िल्टर करने लायक टेक्सचर टाइप के लिए ब्लेंड करने की सुविधा को हटा दिया गया है. समस्या 364987733 देखें.

सुबह के अपडेट

Dawn के लिए अब macOS 11 और iOS 14 की ज़रूरत है. साथ ही, यह सिर्फ़ Metal 2.3+ के साथ काम करता है. समस्या 381117827 देखें.

wgpu::Instance का नया GetWGSLLanguageFeatures() तरीका अब EnumerateWGSLLanguageFeatures() की जगह ले लेता है. समस्या 368672124 देखें.

यहां दिए गए बाइंडिंग टाइप की वैल्यू Undefined है. साथ ही, बाइंडिंग लेआउट में इनकी डिफ़ॉल्ट वैल्यू बदल दी गई हैं. समस्या 377820810 देखें.

  • wgpu::BufferBindingType::Undefined अब Uniform हो गया है
  • wgpu::SamplerBindingType::Undefined अब Filtering हो गया है
  • wgpu::TextureSampleType::Undefined अब Float हो गया है
  • wgpu::StorageTextureAccess::Undefinedअब WriteOnly है

इसमें सिर्फ़ कुछ मुख्य हाइलाइट शामिल हैं. कमिट की पूरी सूची देखें.

WebGPU में नया क्या है

WebGPU में नया क्या है सीरीज़ में शामिल सभी विषयों की सूची.

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113