WGSL में 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के लिए सहायता
WGSL में, f16
टाइप, IEEE-754 binary16 (हफ़्ते के हिसाब से सटीक) फ़ॉर्मैट की 16-बिट फ़्लोटिंग-पॉइंट वैल्यू का सेट है. इसका मतलब है कि यह फ़्लोटिंग-पॉइंट नंबर दिखाने के लिए 16 बिट का इस्तेमाल करता है, जबकि सामान्य सिंगल-प्रिसिज़न फ़्लोटिंग-पॉइंट (f32
) के लिए 32 बिट का इस्तेमाल किया जाता है. छोटे साइज़ की वजह से, परफ़ॉर्मेंस में काफ़ी सुधार हो सकता है. खास तौर पर, ज़्यादा डेटा प्रोसेस करते समय.
तुलना के लिए, Apple M1 Pro डिवाइस पर, WebLLM चैट डेमो में इस्तेमाल किए गए Llama2 7B मॉडल को f16
लागू करने में, f32
को लागू करने के मुकाबले काफ़ी कम समय लगता है. साथ ही, प्रीफ़िल की स्पीड में 28% और डिकोड करने की स्पीड में 41% की बढ़ोतरी होती है. इसकी जानकारी यहां दिए गए स्क्रीनशॉट में दी गई है.
सभी जीपीयू, 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के साथ काम नहीं करते. जब "shader-f16"
सुविधा किसी GPUAdapter
में उपलब्ध हो, तो अब इस सुविधा के साथ GPUDevice
का अनुरोध किया जा सकता है. साथ ही, ऐसा WGSL शेडर मॉड्यूल बनाया जा सकता है जो आधी सटीक फ़्लोटिंग-पॉइंट टाइप f16
का फ़ायदा लेता हो. WGSL शेडर मॉड्यूल में इस टाइप का इस्तेमाल सिर्फ़ तब किया जा सकता है, जब enable f16;
के साथ f16
WGSL एक्सटेंशन चालू किया गया हो. ऐसा न करने पर, createShaderModule() पुष्टि करने से जुड़ी गड़बड़ी जनरेट करेगा. यहां दिया गया छोटा उदाहरण और issue dawn:1510 देखें.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
"shader-f16"
सुविधा के साथ काम करने के आधार पर, WGSL शेडर मॉड्यूल कोड में alias
के साथ f16
और f32
, दोनों टाइप का इस्तेमाल किया जा सकता है. इस बारे में नीचे दिए गए स्निपेट में बताया गया है.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
अपनी सीमाओं को लांघना
सभी कलर अटैचमेंट में, रेंडर पाइपलाइन के आउटपुट डेटा के एक सैंपल (पिक्सल या सब-पिक्सल) को सेव करने के लिए, डिफ़ॉल्ट रूप से 32 बाइट की ज़रूरत होती है. अब maxColorAttachmentBytesPerSample
की सीमा का इस्तेमाल करके, ज़्यादा से ज़्यादा 64 लोगों के लिए अनुरोध किया जा सकता है. यहां दिया गया उदाहरण देखें और issue dawn:2036 देखें.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
सभी प्लैटफ़ॉर्म पर, इंटर-स्टेज कम्यूनिकेशन के लिए इस्तेमाल की जाने वाली maxInterStageShaderVariables
और maxInterStageShaderComponents
की सीमाओं को बढ़ा दिया गया है. ज़्यादा जानकारी के लिए, issue dawn:1448 देखें.
हर शेडर स्टेज के लिए, स्टोरेज बफ़र के तौर पर काम करने वाले पाइपलाइन लेआउट में, बाइंड ग्रुप लेआउट की ज़्यादा से ज़्यादा संख्या डिफ़ॉल्ट रूप से आठ होती है. अब maxStorageBuffersPerShaderStage
की सीमा का इस्तेमाल करके, 10 तक के अनुरोध किए जा सकते हैं. issue dawn:2159 देखें.
maxBindGroupsPlusVertexBuffers
की नई सीमा जोड़ी गई है. इसमें एक साथ इस्तेमाल किए जाने वाले बाइंड ग्रुप और वर्टिक्स बफ़र स्लॉट की ज़्यादा से ज़्यादा संख्या शामिल होती है. इसमें सबसे ज़्यादा इंडेक्स के नीचे मौजूद खाली स्लॉट की गिनती भी की जाती है. इसकी डिफ़ॉल्ट वैल्यू 24 होती है. issue dawn:1849 देखें.
डेप्थ-स्टेंसिल स्टेटस में बदलाव
डेवलपर के अनुभव को बेहतर बनाने के लिए, अब डेप्थ-स्टेंसिल स्टेटस depthWriteEnabled
और depthCompare
एट्रिब्यूट की हमेशा ज़रूरत नहीं होती: depthWriteEnabled
सिर्फ़ डेप्थ वाले फ़ॉर्मैट के लिए ज़रूरी है. अगर डेप्थ वाले फ़ॉर्मैट का इस्तेमाल नहीं किया जाता है, तो depthCompare
की ज़रूरत नहीं होती. issue dawn:2132 देखें.
अडैप्टर की जानकारी से जुड़े अपडेट
जब उपयोगकर्ता ने chrome://flags/#enable-webgpu-developer-features
पर "WebGPU डेवलपर सुविधाएं" फ़्लैग चालू किया हो, तो अब requestAdapterInfo() को कॉल करने पर, अडैप्टर की जानकारी वाले स्टैंडर्ड type
और backend
एट्रिब्यूट के अलावा अन्य एट्रिब्यूट भी उपलब्ध होंगे. type
"डिस्क्रेट जीपीयू", "इंटिग्रेटेड जीपीयू", "सीपीयू" या "जानकारी नहीं है" हो सकता है. backend
, "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" या "null" हो सकता है. issue dawn:2112 और issue dawn:2107 देखें.
requestAdapterInfo() में, unmaskHints
सूची पैरामीटर को हटा दिया गया है. हालांकि, इसका इस्तेमाल करना ज़रूरी नहीं है. issue dawn:1427 देखें.
टाइमस्टैंप क्वेरी को क्वांटिज़ करना
टाइमस्टैंप क्वेरी की मदद से, ऐप्लिकेशन नैनोसेकंड के सटीक अंतराल में GPU निर्देशों के लागू होने में लगने वाले समय का आकलन कर सकते हैं. हालांकि, WebGPU स्पेसिफ़िकेशन में टाइमस्टैंप क्वेरी को टाइमिंग अटैक की समस्याओं की वजह से वैकल्पिक बनाया गया है. Chrome की टीम का मानना है कि टाइमस्टैंप क्वेरी को क्वांटाइज़ करने से, सटीक जानकारी और सुरक्षा के बीच एक अच्छा समझौता होता है. इससे रिज़ॉल्यूशन को 100 माइक्रोसेकंड तक कम किया जा सकता है. issue dawn:1800 देखें.
Chrome में, उपयोगकर्ता chrome://flags/#enable-webgpu-developer-features
पर "WebGPU डेवलपर सुविधाएं" फ़्लैग को चालू करके, टाइमस्टैंप क्वांटिज़ेशन को बंद कर सकते हैं. ध्यान दें कि सिर्फ़ इस फ़्लैग से "timestamp-query"
सुविधा चालू नहीं होती. इसे लागू करने की सुविधा अब भी एक्सपेरिमेंट के तौर पर उपलब्ध है. इसलिए, chrome://flags/#enable-unsafe-webgpu
पर "असुरक्षित WebGPU की सहायता" फ़्लैग की ज़रूरत होती है.
Dawn में, "timestamp_quantization" नाम का एक नया डिवाइस टॉगल जोड़ा गया है. यह डिफ़ॉल्ट रूप से चालू होता है. नीचे दिए गए स्निपेट में, किसी डिवाइस का अनुरोध करते समय, टाइमस्टैंप को क्वांटिज़ किए बिना, एक्सपेरिमेंट के तौर पर उपलब्ध "टाइमस्टैंप-क्वेरी" सुविधा को अनुमति देने का तरीका बताया गया है.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
समय-समय पर साफ़-सफ़ाई करने की सुविधाएं
एक्सपेरिमेंट के तौर पर उपलब्ध "timestamp-query-inside-passes" सुविधा का नाम बदलकर "chromium-experimental-timestamp-query-inside-passes" कर दिया गया है. इससे डेवलपर को यह पता चल पाएगा कि यह सुविधा एक्सपेरिमेंट के तौर पर उपलब्ध है और फ़िलहाल, सिर्फ़ Chromium पर आधारित ब्राउज़र में काम करती है. issue dawn:1193 देखें.
एक्सपेरिमेंट के तौर पर उपलब्ध "pipeline-statistics-query" सुविधा को हटा दिया गया है. इसे सिर्फ़ कुछ हद तक लागू किया गया था. अब इसे डेवलप नहीं किया जा रहा है. issue chromium:1177506 देखें.
इसमें सिर्फ़ कुछ खास हाइलाइट शामिल हैं. कमिट की पूरी सूची देखें.
WebGPU में नया क्या है
WebGPU में नया क्या है सीरीज़ में शामिल सभी चीज़ों की सूची.
Chrome 132
- टेक्स्चर व्यू का इस्तेमाल
- 32-बिट फ़्लोट टेक्स्चर ब्लेंडिंग
- GPUDevice adapterInfo एट्रिब्यूट
- अमान्य फ़ॉर्मैट के साथ कैनवस कॉन्टेक्स्ट को कॉन्फ़िगर करने पर, JavaScript से जुड़ी गड़बड़ी का मैसेज मिलना
- टेक्स्चर पर सैंपलर की पाबंदियों को फ़िल्टर करना
- सबग्रुप के लिए एक्सपेरिमेंट की सुविधा को बेहतर बनाना
- डेवलपर के अनुभव को बेहतर बनाना
- 16-बिट नॉर्मलाइज़ किए गए टेक्सचर फ़ॉर्मैट के लिए, एक्सपेरिमेंट के तौर पर उपलब्ध सहायता
- Dawn से जुड़े अपडेट
Chrome 131
- WGSL में दूरियों को क्लिप करना
- GPUCanvasContext getConfiguration()
- पॉइंट और लाइन प्राइमिटिव में डीपथ बायस नहीं होना चाहिए
- सबग्रुप के लिए, सभी को ध्यान में रखकर स्कैन करने की सुविधा के साथ पहले से मौजूद फ़ंक्शन
- मल्टी-ड्रॉ इनडायरेक्ट के लिए एक्सपेरिमेंटल सपोर्ट
- शेडर मॉड्यूल कंपाइल करने का विकल्प, सख्त गणित
- GPUAdapter requestAdapterInfo() को हटाना
- Dawn से जुड़े अपडेट
Chrome 130
- दो सोर्स को ब्लेंड करना
- Metal पर शेडर को कंपाइल करने में लगने वाले समय में सुधार
- GPUAdapter requestAdapterInfo() का इस्तेमाल बंद करना
- Dawn से जुड़े अपडेट
Chrome 129
Chrome 128
- सबग्रुप के साथ एक्सपेरिमेंट करना
- रेखाओं और बिंदुओं के लिए, डेप्थ बायस की सेटिंग को बंद करना
- preventDefault का इस्तेमाल करने पर, DevTools में गड़बड़ी की चेतावनी न दिखाएं
- WGSL, सैंपलिंग को पहले इंटरपोल करता है और फिर
- Dawn से जुड़े अपडेट
Chrome 127
- Android पर OpenGL ES के लिए एक्सपेरिमेंटल सपोर्ट
- GPUAdapter info एट्रिब्यूट
- WebAssembly के इंटरऑपरेबिलिटी में सुधार
- कमांड एन्कोडर से जुड़ी गड़बड़ियों को बेहतर बनाया गया
- Dawn से जुड़े अपडेट
Chrome 126
- maxTextureArrayLayers की सीमा बढ़ाना
- Vulkan बैकएंड के लिए, बफ़र अपलोड को ऑप्टिमाइज़ करना
- शेडर को कंपाइल करने में लगने वाले समय में सुधार
- सबमिट की गई कमांड बफ़र यूनीक होनी चाहिए
- Dawn से जुड़े अपडेट
Chrome 125
Chrome 124
- सिर्फ़ पढ़ने के लिए और पढ़ने-लिखने के लिए स्टोरेज टेक्स्चर
- Service workers और शेयर किए गए workers के लिए सहायता
- अडैप्टर की जानकारी देने वाले नए एट्रिब्यूट
- गड़बड़ियां ठीक की गईं
- Dawn से जुड़े अपडेट
Chrome 123
- WGSL में DP4a के बिल्ट-इन फ़ंक्शन के साथ काम करने की सुविधा
- WGSL में बिना पाबंदी वाले पॉइंटर पैरामीटर
- WGSL में कॉम्पोज़िट को डीरेफ़रंस करने के लिए सिंटैक्स शुगर
- स्टेंसिल और डेप्थ के लिए, रीड-ओनली मोड की अलग-अलग स्थिति
- Dawn से जुड़े अपडेट
Chrome 122
- कंपैटबिलिटी मोड की मदद से रीच बढ़ाना (यह सुविधा डेवलप की जा रही है)
- maxVertexAttributes की सीमा बढ़ाना
- Dawn से जुड़े अपडेट
Chrome 121
- Android पर WebGPU की सुविधा
- Windows पर शेडर को कंपाइल करने के लिए, FXC के बजाय DXC का इस्तेमाल करना
- कंप्यूट और रेंडर पास में टाइमस्टैंप क्वेरी
- शेडर मॉड्यूल के लिए डिफ़ॉल्ट एंट्री पॉइंट
- GPUExternalTexture कलर स्पेस के तौर पर display-p3 का इस्तेमाल करना
- मेमोरी हेप की जानकारी
- Dawn से जुड़े अपडेट
Chrome 120
- WGSL में 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के लिए सहायता
- सीमाओं को पार करना
- डेप्थ-स्टेंसिल स्टेटस में बदलाव
- अडैप्टर की जानकारी से जुड़े अपडेट
- टाइमस्टैंप क्वेरी को क्वांटाइज़ करना
- समय-समय पर साफ़-सफ़ाई करने की सुविधाएं
Chrome 119
- फ़िल्टर किए जा सकने वाले 32-बिट फ़्लोट टेक्सचर
- unorm10-10-10-2 वर्टिक्स फ़ॉर्मैट
- rgb10a2uint टेक्स्चर फ़ॉर्मैट
- Dawn से जुड़े अपडेट
Chrome 118
copyExternalImageToTexture()
में HTMLImageElement और ImageData की सुविधा- रीड-राइट और रीड-ओनली स्टोरेज टेक्स्चर के लिए, एक्सपेरिमेंट के तौर पर उपलब्ध सहायता
- Dawn से जुड़े अपडेट
Chrome 117
- वर्टिक्स बफ़र को अनसेट करना
- बाइंड किए गए ग्रुप को अनसेट करना
- डिवाइस खो जाने पर, असाइनमेंट के लिए असाइनमेंट पाइपलाइन बनाने से जुड़ी गड़बड़ियों को रोकना
- SPIR-V शेडर मॉड्यूल बनाने से जुड़े अपडेट
- डेवलपर के अनुभव को बेहतर बनाना
- अपने-आप जनरेट हुए लेआउट की मदद से, पाइपलाइन को कैश मेमोरी में सेव करना
- Dawn से जुड़े अपडेट
Chrome 116
- WebCodecs इंटिग्रेशन
- GPUAdapter
requestDevice()
से खोया हुआ डिवाइस वापस मिलना importExternalTexture()
को कॉल करने पर, वीडियो चलाने की सुविधा को बिना रुकावट के जारी रखना- स्पेसिफ़िकेशन के मुताबिक होना
- डेवलपर के अनुभव को बेहतर बनाना
- Dawn से जुड़े अपडेट
Chrome 115
- WGSL भाषा के इस्तेमाल किए जा सकने वाले एक्सटेंशन
- Direct3D 11 के लिए एक्सपेरिमेंटल सपोर्ट
- AC पावर पर डिफ़ॉल्ट रूप से डिसक्रेट जीपीयू पाना
- डेवलपर के अनुभव को बेहतर बनाना
- Dawn से जुड़े अपडेट
Chrome 114
- Optimize JavaScript
- बिना कॉन्फ़िगर किए गए कैनवस पर getCurrentTexture() से InvalidStateError मिलता है
- WGSL से जुड़े अपडेट
- Dawn से जुड़े अपडेट