WGSL में 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के साथ काम करता है
डब्ल्यूजीएसएल में, f16
टाइप, आईईईई-754 बाइनरी16 (हाफ़ सटीक) फ़ॉर्मैट के 16-बिट फ़्लोटिंग-पॉइंट वैल्यू का सेट होता है. इसका मतलब है कि यह फ़्लोटिंग-पॉइंट नंबर को दिखाने के लिए 16 बिट का इस्तेमाल करता है, जबकि कंवेंशनल सिंगल-प्रीसिज़न फ़्लोटिंग-पॉइंट (f32
) के लिए, 32 बिट का इस्तेमाल नहीं करता. इस छोटे साइज़ की वजह से, परफ़ॉर्मेंस में सुधार हो सकता है. खास तौर पर, ऐसा तब होता है, जब बहुत ज़्यादा डेटा प्रोसेस किया जाता है.
तुलना के लिए, Apple M1 Pro डिवाइस पर, WebLLM चैट डेमो में इस्तेमाल किए गए Llama2 7B मॉडल के f16
को लागू करने की प्रोसेस, f32
की तुलना में काफ़ी तेज़ है. इसमें डेटा पहले से भरने की स्पीड में 28% और डिकोड करने की स्पीड में 41% का सुधार हुआ है, जैसा कि नीचे दिए गए स्क्रीनशॉट में दिखाया गया है.
सभी जीपीयू में, 16-बिट फ़्लोटिंग-पॉइंट वैल्यू काम नहीं करती. GPUAdapter
में "shader-f16"
सुविधा उपलब्ध होने पर, इस सुविधा के साथ GPUDevice
का अनुरोध किया जा सकता है. साथ ही, एक WGSL शेडर मॉड्यूल बनाया जा सकता है, जो आधी-सटीक वैल्यू वाले फ़्लोटिंग-पॉइंट टाइप f16
का इस्तेमाल करता है. इस टाइप का इस्तेमाल, WGSL शेडर मॉड्यूल में सिर्फ़ तब किया जा सकता है, जब enable f16;
के साथ f16
WGSL एक्सटेंशन को चालू किया गया हो. ऐसा न करने पर, createShaderModule() पुष्टि की गड़बड़ी जनरेट होगी. नीचे दिया गया कम से कम उदाहरण और समस्या सुबह:1510 देखें.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
"shader-f16"
की सुविधा के आधार पर alias
के साथ WGSL शेडर मॉड्यूल कोड में f16
और f32
, दोनों टाइप के साथ काम किया जा सकता है, जैसा कि नीचे दिए गए स्निपेट में दिखाया गया है.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
सारी सीमाएं पार करें
सभी रंग के अटैचमेंट में, पाइपलाइन आउटपुट डेटा के एक सैंपल (पिक्सल या सब-पिक्सल) को होल्ड करने के लिए ज़रूरी बाइट की ज़्यादा से ज़्यादा संख्या, डिफ़ॉल्ट रूप से 32 बाइट होती है. अब maxColorAttachmentBytesPerSample
की सीमा का इस्तेमाल करके, 64 तक का अनुरोध किया जा सकता है. नीचे दिया गया उदाहरण और समस्या सुबह:2036 देखें.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
सभी प्लैटफ़ॉर्म पर, इंटर-स्टेज कम्यूनिकेशन के लिए इस्तेमाल की जाने वाली maxInterStageShaderVariables
और maxInterStageShaderComponents
की सीमाएं बढ़ा दी गई हैं. ज़्यादा जानकारी के लिए, समस्या dawn:1448 देखें.
शेडर के हर स्टेज के लिए, किसी पाइपलाइन लेआउट में बाइंड ग्रुप लेआउट की एंट्री की ज़्यादा से ज़्यादा संख्या, डिफ़ॉल्ट रूप से आठ होती है. यह संख्या स्टोरेज बफ़र होती है. अब maxStorageBuffersPerShaderStage
की सीमा का इस्तेमाल करके, 10 लोगों तक का अनुरोध किया जा सकता है. समस्या dawn:2159 देखें.
maxBindGroupsPlusVertexBuffers
की नई सीमा जोड़ दी गई है. इसमें एक साथ इस्तेमाल किए जाने वाले बाइंड ग्रुप और वर्टेक्स बफ़र स्लॉट की ज़्यादा से ज़्यादा संख्या होती है. इसकी वजह से, सबसे ज़्यादा इंडेक्स के नीचे मौजूद खाली स्लॉट की गिनती की जाती है. इसकी डिफ़ॉल्ट वैल्यू 24 है. समस्या सुबह:1849 देखें.
डेप्थ-स्टेंसिल की स्थिति में बदलाव
डेवलपर के अनुभव को बेहतर बनाने के लिए, अब डेप्थ स्टेंसिल की स्थिति depthWriteEnabled
और depthCompare
एट्रिब्यूट की हमेशा ज़रूरत नहीं होती है: सिर्फ़ डेप्थ वाले फ़ॉर्मैट के लिए depthWriteEnabled
की ज़रूरत होती है. अगर डेप्थ वाले फ़ॉर्मैट का इस्तेमाल नहीं किया जाता है, तो उनके लिए depthCompare
की ज़रूरत नहीं होती. समस्या dawn:2132 देखें.
अडैप्टर की जानकारी के अपडेट
अगर उपयोगकर्ता ने "WebGPU डेवलपर सुविधाएं" चालू की हैं, तो अब requestAdapterInfo() को कॉल करने पर, नॉन-स्टैंडर्ड type
और backend
अडैप्टर की जानकारी वाले एट्रिब्यूट उपलब्ध होंगे chrome://flags/#enable-webgpu-developer-features
पर फ़्लैग. type
, "अलग-अलग जीपीयू", "इंटिग्रेट किया गया जीपीयू", "सीपीयू" या "जानकारी नहीं है" हो सकता है. backend
या तो "WebGPU", "D3D11", "D3D12", "मेटल", "vulkan", "openGL", "openGLES" या "null" हो. समस्या dawn:2112 और समस्या सुबह:2107 देखें.
requestAdapterInfo() में मौजूद वैकल्पिक unmaskHints
सूची पैरामीटर को हटा दिया गया है. समस्या सुबह:1427 देखें.
टाइमस्टैंप में शामिल क्वेरी की गिनती करने की सुविधा
टाइमस्टैंप क्वेरी से ऐप्लिकेशन, नैनोसेकंड सटीक तरीके से जीपीयू कमांड के एक्ज़ीक्यूशन का समय माप सकते हैं. हालांकि, WebGPU की खास बातें टाइमिंग अटैक की समस्याओं की वजह से, टाइमस्टैंप क्वेरी को ज़रूरी नहीं बनाती हैं. Chrome टीम का मानना है कि टाइमस्टैंप क्वेरी की संख्या की गणना करने से, रिज़ॉल्यूशन को घटाकर 100 माइक्रोसेकंड कर दिया जाता है, जिससे सटीक और सुरक्षा के बीच अच्छा तालमेल बना रहता है. समस्या सुबह:1800 देखें.
Chrome में उपयोगकर्ता, "WebGPU डेवलपर सुविधाओं" को चालू करके टाइमस्टैंप में मौजूद डेटा की संख्या में बदलाव करने की सुविधा को बंद कर सकते हैं flag को chrome://flags/#enable-webgpu-developer-features
पर करें. ध्यान दें कि सिर्फ़ इस फ़्लैग से "timestamp-query"
सुविधा चालू नहीं होती. इसे लागू करने की प्रोसेस पर अब भी प्रयोग जारी है. इसलिए, इसे "असुरक्षित WebGPU सहायता" की ज़रूरत है chrome://flags/#enable-unsafe-webgpu
पर फ़्लैग करें.
डॉन में, "timestamp_quantization" नाम का एक नया डिवाइस टॉगल को जोड़ दिया गया है और यह डिफ़ॉल्ट रूप से चालू है. नीचे दिए गए स्निपेट में, प्रयोग के तौर पर इस्तेमाल की जा रही "timestamp-query" को अनुमति देने का तरीका बताया गया है किसी डिवाइस का अनुरोध करते समय, इस सुविधा में टाइमस्टैंप की माप की ज़रूरत नहीं होती.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
साफ़-सफ़ाई के लिए इस्तेमाल होने वाली सुविधाएं
एक्सपेरिमेंट के तौर पर शुरू किया गया "timestamp-query-inside-passes" सुविधा का नाम बदलकर "Chromium-experimental-timestamp-query-inside-passes" कर दिया गया है ताकि डेवलपर को यह साफ़ तौर पर बताया जा सके कि यह सुविधा एक्सपेरिमेंट के तौर पर उपलब्ध है और फ़िलहाल सिर्फ़ Chromium पर आधारित ब्राउज़र में उपलब्ध है. समस्या dawn:1193 देखें.
एक्सपेरिमेंट के तौर पर शुरू की गई "पाइपलाइन-स्टैटिस्टिक्स-क्वेरी" सुविधा को हटा दिया गया है, क्योंकि यह अब डेवलप नहीं हो रही है. इस सुविधा का सिर्फ़ कुछ हिस्सा लागू किया गया था. Chromium:1177506 से जुड़ी समस्या देखें.
इसमें सिर्फ़ कुछ अहम हाइलाइट के बारे में बताया गया है. वादों की पूरी सूची देखें.
WebGPU में नया क्या है
WebGPU में नया क्या है सीरीज़ में शामिल सभी चीज़ों की सूची.
Chrome 128
- सबग्रुप के साथ एक्सपेरिमेंट करना
- लाइनों और पॉइंट के लिए, डेप्थ बायस की सेटिंग को बंद करना
- PauseDefault के तहत, कैप्चर नहीं की गई गड़बड़ी की चेतावनी छिपाएं
- WGSL, पहले सैंपलिंग को इंटरपोलेट करता है और दोनों में से किसी एक
- डॉन से जुड़े अपडेट
Chrome 127
- Android पर OpenGL ES के लिए प्रयोग के तौर पर उपलब्ध सहायता
- GPUAdapter की जानकारी वाला एट्रिब्यूट
- WebAssembly इंटरऑप में सुधार
- निर्देश एन्कोडर से जुड़ी बेहतर गड़बड़ियां
- डॉन से जुड़े अपडेट
Chrome 126
- maxTextureArraylayers की सीमा बढ़ाना
- Vulkan बैकएंड के लिए, बफ़र अपलोड को ऑप्टिमाइज़ करना
- समय को बेहतर बनाने के लिए शेडर इस्तेमाल करने की सुविधा
- सबमिट किए गए निर्देश के बफ़र, यूनीक होने चाहिए
- डॉन से जुड़े अपडेट
Chrome 125
Chrome 124
- रीड-ओनली और रीड-राइट स्टोरेज टेक्सचर
- सर्विस वर्कर और शेयर किए गए कर्मचारियों के लिए सहायता
- अडैप्टर की जानकारी देने वाले नए एट्रिब्यूट
- गड़बड़ियां ठीक की गईं
- डॉन से जुड़े अपडेट
Chrome 123
- WGSL में DP4a बिल्ट-इन फ़ंक्शन काम करते हैं
- WGSL में बिना पाबंदी वाले पॉइंटर पैरामीटर
- डब्ल्यूजीएसएल में कंपोज़िट को डीरेफ़रेंस करने के लिए सिंटैक्स शुगर
- स्टेंसल और डेप्थ के पहलुओं के लिए, रीड-ओनली स्टेटस अलग करना
- डॉन से जुड़े अपडेट
Chrome 122
- कंपैटबिलिटी मोड की मदद से, ज़्यादा से ज़्यादा लोगों तक पहुंचें (डेवलपमेंट में उपलब्ध सुविधा)
- maxVertexAttributes की सीमा बढ़ाना
- डॉन से जुड़े अपडेट
Chrome 121
- Android पर WebGPU के साथ काम करना
- Windows पर शेडर को कंपाइल करने के लिए, FXC के बजाय DXC का इस्तेमाल करना
- कंप्यूट और रेंडर में टाइमस्टैंप क्वेरी
- शेडर मॉड्यूल के लिए डिफ़ॉल्ट एंट्री पॉइंट
- GPExternalTexture कलर स्पेस के तौर पर Display-p3 का इस्तेमाल करना
- मेमोरी हीप की जानकारी
- डॉन से जुड़े अपडेट
Chrome 120
- WGSL में 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के साथ काम करता है
- सीमाएं पार करें
- डेप्थ-स्टेंसिल की स्थिति में बदलाव
- अडैप्टर की जानकारी के अपडेट
- टाइमस्टैंप क्वेरी की गिनती करना
- वसंत साफ़ करने की सुविधाएं
Chrome 119
- फ़िल्टर किए जा सकने वाले 32-बिट फ़्लोट टेक्सचर
- unorm10-10-10-2 वर्टेक्स फ़ॉर्मैट
- आरजीबी10a2uint टेक्स्चर फ़ॉर्मैट
- डॉन से जुड़े अपडेट
Chrome 118
copyExternalImageToTexture()
में HTMLImageElement और ImageData सहायता- रीड-ओनली और रीड-ओनली स्टोरेज टेक्स्चर के लिए एक्सपेरिमेंट के तौर पर उपलब्ध सहायता
- डॉन से जुड़े अपडेट
Chrome 117
- वर्टेक्स बफ़र को अनसेट करें
- बाइंड किए गए ग्रुप को अनसेट करें
- डिवाइस खो जाने पर, एक साथ काम न करने वाली पाइपलाइन बनाने की वजह से होने वाली गड़बड़ियों की आवाज़ बंद करना
- SPIR-V शेडर मॉड्यूल बनाने से जुड़े अपडेट
- डेवलपर के अनुभव को बेहतर बनाना
- अपने-आप जनरेट होने वाले लेआउट की मदद से पाइपलाइन को कैश मेमोरी में सेव करना
- डॉन से जुड़े अपडेट
Chrome 116
- WebCodecs इंटिग्रेशन
- GPAdapter
requestDevice()
से खोया हुआ डिवाइस लौटाया गया - अगर
importExternalTexture()
चालू है, तो वीडियो बिना किसी रुकावट के चलाएं - खास जानकारी का पालन
- डेवलपर के अनुभव को बेहतर बनाना
- डॉन से जुड़े अपडेट
Chrome 115
- WGSL के साथ काम करने वाले भाषा एक्सटेंशन
- Direct3D 11 के लिए एक्सपेरिमेंट के तौर पर उपलब्ध सहायता
- एसी पावर पर, डिफ़ॉल्ट रूप से अलग-अलग जीपीयू पाएं
- डेवलपर के अनुभव को बेहतर बनाना
- डॉन से जुड़े अपडेट
Chrome 114
- JavaScript ऑप्टिमाइज़ करना
- कॉन्फ़िगर नहीं किए गए कैनवस पर getCurrentTexture() से अमान्य स्थिति गड़बड़ी मिलती है
- WGSL से जुड़े अपडेट
- डॉन से जुड़े अपडेट