WebGPU (Chrome→121) में नया क्या है

François Beaufort
François Beaufort

Android पर WebGPU की सुविधा

Chrome की टीम यह बताते हुए खुश है कि WebGPU अब Chrome 121 में डिफ़ॉल्ट रूप से चालू है. यह सुविधा, Android 12 और उसके बाद के वर्शन पर काम करने वाले उन डिवाइसों पर उपलब्ध है जिनमें Qualcomm और ARM GPU का इस्तेमाल किया गया है.

आने वाले समय में, यह सुविधा धीरे-धीरे Android के कई डिवाइसों पर उपलब्ध कराई जाएगी. इनमें, Android 11 पर काम करने वाले डिवाइस भी शामिल हैं. यह सुविधा, हार्डवेयर कॉन्फ़िगरेशन की एक बड़ी रेंज में बिना किसी रुकावट के काम करे, यह पक्का करने के लिए ज़्यादा टेस्टिंग और ऑप्टिमाइज़ेशन की ज़रूरत होगी. issue chromium:1497815 देखें.

Android के लिए Chrome पर चल रहे WebGPU सैंपल का स्क्रीनशॉट.
Android के लिए Chrome पर चल रहा WebGPU सैंपल.

Windows पर शेडर कोड को कंपाइल करने के लिए, FXC के बजाय DXC का इस्तेमाल करना

Chrome अब DXC (DirectX कंपाइलर) की मदद से, Windows D3D12 मशीनों पर शेडर को कॉम्पाइल करता है. ये मशीनें, SM6+ ग्राफ़िक्स हार्डवेयर से लैस होती हैं. पहले, WebGPU Windows पर शेडर को कंपाइल करने के लिए, FXC (FX कंपाइलर) पर निर्भर था. हालांकि, FXC के लिए सुविधाएं सेट और परफ़ॉर्मेंस ऑप्टिमाइज़ेशन के मामले में कमी है. हालांकि, DXC में कोई सुविधा नहीं है.

शुरुआती जांच से पता चलता है कि FXC की तुलना में DXC का इस्तेमाल करने पर, कंप्यूट शेडर को कंपाइल करने की स्पीड में औसतन 20% की बढ़ोतरी होती है.

कैलकुलेट और रेंडर पास में टाइमस्टैंप क्वेरी

टाइमस्टैंप क्वेरी की मदद से, WebGPU ऐप्लिकेशन यह सटीक तरीके से मेज़र कर सकते हैं कि उनके GPU कमांड को कैलकुलेट और रेंडर पास करने में कितना समय लगता है. यह मेज़रमेंट नैनोसेकंड तक किया जा सकता है. इनका ज़्यादा इस्तेमाल, जीपीयू के वर्कलोड की परफ़ॉर्मेंस और व्यवहार के बारे में अहम जानकारी पाने के लिए किया जाता है.

जब "timestamp-query" सुविधा किसी GPUAdapter में उपलब्ध हो, तो ये काम किए जा सकते हैं:

  • "timestamp-query" सुविधा के साथ GPUDevice का अनुरोध करें.
  • "timestamp" टाइप का GPUQuerySet बनाएं.
  • GPUQuerySet में टाइमस्टैंप वैल्यू कहां लिखनी है, यह तय करने के लिए GPUComputePassDescriptor.timestampWrites और GPURenderPassDescriptor.timestampWrites का इस्तेमाल करें.
  • resolveQuerySet() की मदद से, टाइमस्टैंप की वैल्यू को GPUBuffer में बदलें.
  • GPUBuffer से सीपीयू में नतीजे कॉपी करके, टाइमस्टैंप की वैल्यू वापस पढ़ें.
  • टाइमस्टैंप की वैल्यू को BigInt64Array के तौर पर डिकोड करें.

नीचे दिया गया उदाहरण देखें और dawn:1800 जारी करें.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("timestamp-query")) {
  throw new Error("Timestamp query feature is not available");
}
// Explicitly request timestamp query feature.
const device = await adapter.requestDevice({
  requiredFeatures: ["timestamp-query"],
});
const commandEncoder = device.createCommandEncoder();

// Create a GPUQuerySet which holds 2 timestamp query results: one for the
// beginning and one for the end of compute pass execution.
const querySet = device.createQuerySet({ type: "timestamp", count: 2 });
const timestampWrites = {
  querySet,
  beginningOfPassWriteIndex: 0, // Write timestamp in index 0 when pass begins.
  endOfPassWriteIndex: 1, // Write timestamp in index 1 when pass ends.
};
const passEncoder = commandEncoder.beginComputePass({ timestampWrites });
// TODO: Set pipeline, bind group, and dispatch work to be performed.
passEncoder.end();

// Resolve timestamps in nanoseconds as a 64-bit unsigned integer into a GPUBuffer.
const size = 2 * BigInt64Array.BYTES_PER_ELEMENT;
const resolveBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.QUERY_RESOLVE | GPUBufferUsage.COPY_SRC,
});
commandEncoder.resolveQuerySet(querySet, 0, 2, resolveBuffer, 0);

// Read GPUBuffer memory.
const resultBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.COPY_DST | GPUBufferUsage.MAP_READ,
});
commandEncoder.copyBufferToBuffer(resolveBuffer, 0, resultBuffer, 0, size);

// Submit commands to the GPU.
device.queue.submit([commandEncoder.finish()]);

// Log compute pass duration in nanoseconds.
await resultBuffer.mapAsync(GPUMapMode.READ);
const times = new BigInt64Array(resultBuffer.getMappedRange());
console.log(`Compute pass duration: ${Number(times[1] - times[0])}ns`);
resultBuffer.unmap();

टाइमिंग अटैक से जुड़ी समस्याओं की वजह से, टाइमस्टैंप क्वेरी को 100 माइक्रोसेकंड के रिज़ॉल्यूशन के साथ क्वांटाइज़ किया जाता है. इससे, सटीक जानकारी और सुरक्षा के बीच एक अच्छा समझौता होता है. Chrome ब्राउज़र में, अपने ऐप्लिकेशन के डेवलपमेंट के दौरान, chrome://flags/#enable-webgpu-developer-features पर "WebGPU डेवलपर सुविधाएं" फ़्लैग को चालू करके, टाइमस्टैंप क्वांटिज़ेशन की सुविधा बंद की जा सकती है. ज़्यादा जानने के लिए, टाइमस्टैंप क्वेरी क्वांटिज़ेशन देखें.

जीपीयू कभी-कभी टाइमस्टैंप काउंटर को रीसेट कर सकते हैं. इससे टाइमस्टैंप के बीच नेगेटिव डेल्टा जैसी अनचाही वैल्यू मिल सकती हैं. हमारा सुझाव है कि आप git diff में हुए बदलाव देखें. इससे, नीचे दिए गए Compute Boids सैंपल में टाइमस्टैंप क्वेरी के लिए सहायता मिलती है.

टाइमस्टैंप क्वेरी वाले Compute Boids सैंपल का स्क्रीनशॉट.
टाइमस्टैंप क्वेरी वाले Boids सैंपल का हिसाब लगाएं.

शेडर मॉड्यूल के लिए डिफ़ॉल्ट एंट्री पॉइंट

डेवलपर के अनुभव को बेहतर बनाने के लिए, अब कंप्यूट या रेंडरर पाइपलाइन बनाते समय अपने शेडर मॉड्यूल के entryPoint को हटाया जा सकता है. अगर शेडर कोड में शेडर स्टेज के लिए कोई यूनीक एंट्री पॉइंट नहीं मिलता है, तो GPUValidationError ट्रिगर हो जाएगा. नीचे दिया गया उदाहरण और समस्या dawn:2254 देखें.

const code = `
    @vertex fn vertexMain(@builtin(vertex_index) i : u32) ->
      @builtin(position) vec4f {
       const pos = array(vec2f(0, 1), vec2f(-1, -1), vec2f(1, -1));
       return vec4f(pos[i], 0, 1);
    }
    @fragment fn fragmentMain() -> @location(0) vec4f {
      return vec4f(1, 0, 0, 1);
    }`;
const module = myDevice.createShaderModule({ code });
const format = navigator.gpu.getPreferredCanvasFormat();
const pipeline = await myDevice.createRenderPipelineAsync({
  layout: "auto",
  vertex: { module, entryPoint: "vertexMain" },
  fragment: { module, entryPoint: "fragmentMain", targets: [{ format }] },
  vertex: { module },
  fragment: { module, targets: [{ format }] },
});

GPUExternalTexture के कलर स्पेस के तौर पर display-p3 का इस्तेमाल करना

अब importExternalTexture() की मदद से, एचडीआर वीडियो से GPUExternalTexture इंपोर्ट करते समय, "display-p3" डेस्टिनेशन कलर स्पेस सेट किया जा सकता है. देखें कि WebGPU, कलर स्पेस को कैसे मैनेज करता है. यहां दिया गया उदाहरण और समस्या chromium:1330250 देखें.

// Create texture from HDR video.
const video = document.querySelector("video");
const texture = myDevice.importExternalTexture({
  source: video,
  colorSpace: "display-p3",
});

मेमोरी के ढेर की जानकारी

ऐप्लिकेशन को बनाने के दौरान ज़्यादा मेमोरी असाइन करते समय, मेमोरी की सीमाओं का अनुमान लगाने में आपकी मदद करने के लिए, requestAdapterInfo() अब memoryHeaps से जुड़ी जानकारी दिखाता है. जैसे, अडैप्टर पर उपलब्ध मेमोरी हीप का साइज़ और टाइप. इस एक्सपेरिमेंटल सुविधा को सिर्फ़ तब ऐक्सेस किया जा सकता है, जब chrome://flags/#enable-webgpu-developer-features पर "WebGPU डेवलपर सुविधाएं" फ़्लैग चालू हो. नीचे दिया गया उदाहरण और समस्या सुबह:2249 देखें.

const adapter = await navigator.gpu.requestAdapter();
const adapterInfo = await adapter.requestAdapterInfo();

for (const { size, properties } of adapterInfo.memoryHeaps) {
  console.log(size); // memory heap size in bytes
  if (properties & GPUHeapProperty.DEVICE_LOCAL)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_VISIBLE)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_COHERENT) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_UNCACHED) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_CACHED)   { /* ... */ }
}
https://webgpureport.org का स्क्रीनशॉट, जिसमें अडैप्टर की जानकारी में मेमोरी हेप दिख रही हैं.
https://webgpureport.org पर दिखाए गए अडैप्टर की जानकारी वाली मेमोरी हेप.

डॉन से जुड़े अपडेट

WGSL भाषा की सुविधाओं को मैनेज करने के लिए, wgpu::Instance पर HasWGSLLanguageFeature और EnumerateWGSLLanguageFeatures तरीके जोड़े गए हैं. समस्या dawn:2260 देखें.

स्टैंडर्ड wgpu::Feature::BufferMapExtendedUsages सुविधा की मदद से, wgpu::BufferUsage::MapRead या wgpu::BufferUsage::MapWrite और किसी भी अन्य wgpu::BufferUsage के साथ जीपीयू बफ़र बनाया जा सकता है. यहां दिया गया उदाहरण और समस्या dawn:2204 देखें.

wgpu::BufferDescriptor descriptor = {
  .size = 128,
  .usage = wgpu::BufferUsage::MapWrite | wgpu::BufferUsage::Uniform
};
wgpu::Buffer uniformBuffer = device.CreateBuffer(&descriptor);

uniformBuffer.MapAsync(wgpu::MapMode::Write, 0, 128,
   [](WGPUBufferMapAsyncStatus status, void* userdata)
   {
      wgpu::Buffer* buffer = static_cast<wgpu::Buffer*>(userdata);
      memcpy(buffer->GetMappedRange(), data, sizeof(data));
   },
   &uniformBuffer);

इन सुविधाओं के बारे में जानकारी दी गई है: ANGLE टेक्स्चर शेयरिंग, D3D11 मल्टीथ्रेड प्रोटेक्टेड, डिवाइस सिंक करने की सुविधा, Norm16 टेक्स्चर फ़ॉर्मैट, पास में टाइमस्टैंप क्वेरी, Pixel का लोकल स्टोरेज, शेडर की सुविधाएं, और मल्टी प्लानर फ़ॉर्मैट.

Chrome टीम ने Dwn के लिए आधिकारिक GitHub डेटा स्टोर करने की जगह बनाया है.

इसमें सिर्फ़ कुछ खास हाइलाइट शामिल हैं. कमिट की पूरी सूची देखें.

WebGPU में नया क्या है

WebGPU में नया क्या है सीरीज़ में शामिल सभी चीज़ों की सूची.

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113