Tính năng mới trong WebGPU (Chrome lúc 121)

François Beaufort
François Beaufort

Hỗ trợ WebGPU trên Android

Nhóm Chrome rất vui mừng được thông báo rằng WebGPU hiện được bật theo mặc định trong Chrome 121 trên các thiết bị chạy Android 12 trở lên, sử dụng GPU Qualcomm và ARM.

Trong tương lai gần, chúng tôi sẽ mở rộng phạm vi hỗ trợ để bao gồm nhiều thiết bị Android hơn, bao gồm cả những thiết bị chạy Android 11. Việc mở rộng này sẽ phụ thuộc vào việc kiểm thử và tối ưu hoá thêm để đảm bảo trải nghiệm liền mạch trên nhiều cấu hình phần cứng hơn. Xem vấn đề chromium:1497815.

Ảnh chụp màn hình mẫu WebGPU chạy trên Chrome dành cho Android.
Mẫu WebGPU chạy trên Chrome dành cho Android.

Sử dụng DXC thay vì FXC để biên dịch chương trình đổ bóng trên Windows

Chrome hiện sử dụng sức mạnh của DXC (Trình biên dịch DirectX) để biên dịch chương trình đổ bóng trên các máy Windows D3D12 được trang bị phần cứng đồ hoạ SM6+. Trước đây, WebGPU dựa vào FXC (Trình biên dịch FX) để biên dịch chương trình đổ bóng trên Windows. Mặc dù có chức năng, nhưng FXC thiếu bộ tính năng và tính năng tối ưu hoá hiệu suất có trong DXC.

Thử nghiệm ban đầu cho thấy tốc độ biên dịch chương trình đổ bóng điện toán tăng trung bình 20% khi sử dụng DXC so với FXC.

Truy vấn dấu thời gian trong các lượt kết xuất và kết xuất

Truy vấn dấu thời gian cho phép các ứng dụng WebGPU đo lường chính xác (tính đến nano giây) thời gian các lệnh GPU của chúng cần để thực thi các lượt tính toán và kết xuất. Các chỉ số này được sử dụng rộng rãi để thu thập thông tin chi tiết về hiệu suất và hành vi của khối lượng công việc GPU.

Khi tính năng "timestamp-query" có trong GPUAdapter, bạn có thể làm những việc sau:

  • Yêu cầu GPUDevice bằng tính năng "timestamp-query".
  • Tạo GPUQuerySet thuộc loại "timestamp".
  • Sử dụng GPUComputePassDescriptor.timestampWritesGPURenderPassDescriptor.timestampWrites để xác định vị trí ghi giá trị dấu thời gian trong GPUQuerySet.
  • Giải quyết các giá trị dấu thời gian thành GPUBuffer bằng resolveQuerySet().
  • Đọc lại các giá trị dấu thời gian bằng cách sao chép kết quả từ GPUBuffer vào CPU.
  • Giải mã các giá trị dấu thời gian dưới dạng BigInt64Array.

Hãy xem ví dụ sau và vấn đề dawn:1800.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("timestamp-query")) {
  throw new Error("Timestamp query feature is not available");
}
// Explicitly request timestamp query feature.
const device = await adapter.requestDevice({
  requiredFeatures: ["timestamp-query"],
});
const commandEncoder = device.createCommandEncoder();

// Create a GPUQuerySet which holds 2 timestamp query results: one for the
// beginning and one for the end of compute pass execution.
const querySet = device.createQuerySet({ type: "timestamp", count: 2 });
const timestampWrites = {
  querySet,
  beginningOfPassWriteIndex: 0, // Write timestamp in index 0 when pass begins.
  endOfPassWriteIndex: 1, // Write timestamp in index 1 when pass ends.
};
const passEncoder = commandEncoder.beginComputePass({ timestampWrites });
// TODO: Set pipeline, bind group, and dispatch work to be performed.
passEncoder.end();

// Resolve timestamps in nanoseconds as a 64-bit unsigned integer into a GPUBuffer.
const size = 2 * BigInt64Array.BYTES_PER_ELEMENT;
const resolveBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.QUERY_RESOLVE | GPUBufferUsage.COPY_SRC,
});
commandEncoder.resolveQuerySet(querySet, 0, 2, resolveBuffer, 0);

// Read GPUBuffer memory.
const resultBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.COPY_DST | GPUBufferUsage.MAP_READ,
});
commandEncoder.copyBufferToBuffer(resolveBuffer, 0, resultBuffer, 0, size);

// Submit commands to the GPU.
device.queue.submit([commandEncoder.finish()]);

// Log compute pass duration in nanoseconds.
await resultBuffer.mapAsync(GPUMapMode.READ);
const times = new BigInt64Array(resultBuffer.getMappedRange());
console.log(`Compute pass duration: ${Number(times[1] - times[0])}ns`);
resultBuffer.unmap();

Do lo ngại về tấn công theo thời gian, các truy vấn dấu thời gian được lượng tử hoá với độ phân giải là 100 micro giây, mang lại sự cân bằng tốt giữa độ chính xác và tính bảo mật. Trong trình duyệt Chrome, bạn có thể tắt tính năng lượng tử hoá dấu thời gian bằng cách bật cờ "Tính năng dành cho nhà phát triển WebGPU" tại chrome://flags/#enable-webgpu-developer-features trong quá trình phát triển ứng dụng. Hãy xem phần Lượng tử hoá truy vấn dấu thời gian để tìm hiểu thêm.

Vì GPU đôi khi có thể đặt lại bộ đếm dấu thời gian, điều này có thể dẫn đến các giá trị không mong muốn như delta âm giữa các dấu thời gian, bạn nên xem các thay đổi về git diff để thêm tính năng hỗ trợ truy vấn dấu thời gian vào mẫu Compute Boids sau đây.

Ảnh chụp màn hình mẫu Compute Boids có truy vấn dấu thời gian.
Tính toán mẫu Boids có truy vấn dấu thời gian.

Điểm truy cập mặc định vào mô-đun chương trình đổ bóng

Để cải thiện trải nghiệm của nhà phát triển, giờ đây, bạn có thể bỏ qua entryPoint của mô-đun chương trình đổ bóng khi tạo quy trình kết xuất hoặc tính toán. Nếu không tìm thấy điểm truy cập duy nhất cho giai đoạn chương trình đổ bóng trong mã chương trình đổ bóng, thì GPUValidationError sẽ được kích hoạt. Hãy xem ví dụ sau và vấn đề dawn:2254.

const code = `
    @vertex fn vertexMain(@builtin(vertex_index) i : u32) ->
      @builtin(position) vec4f {
       const pos = array(vec2f(0, 1), vec2f(-1, -1), vec2f(1, -1));
       return vec4f(pos[i], 0, 1);
    }
    @fragment fn fragmentMain() -> @location(0) vec4f {
      return vec4f(1, 0, 0, 1);
    }`;
const module = myDevice.createShaderModule({ code });
const format = navigator.gpu.getPreferredCanvasFormat();
const pipeline = await myDevice.createRenderPipelineAsync({
  layout: "auto",
  vertex: { module, entryPoint: "vertexMain" },
  fragment: { module, entryPoint: "fragmentMain", targets: [{ format }] },
  vertex: { module },
  fragment: { module, targets: [{ format }] },
});

Hỗ trợ display-p3 làm không gian màu GPUExternalTexture

Giờ đây, bạn có thể đặt hệ màu đích "display-p3" khi nhập GPUExternalTexture từ video HDR bằng importExternalTexture(). Hãy xem cách WebGPU xử lý không gian màu. Hãy xem ví dụ sau và vấn đề chromium:1330250.

// Create texture from HDR video.
const video = document.querySelector("video");
const texture = myDevice.importExternalTexture({
  source: video,
  colorSpace: "display-p3",
});

Thông tin về vùng nhớ khối xếp

Để giúp bạn dự đoán các giới hạn về bộ nhớ khi phân bổ lượng lớn trong quá trình phát triển ứng dụng, requestAdapterInfo() hiện hiển thị thông tin memoryHeaps, chẳng hạn như kích thước và loại vùng nhớ khối xếp có sẵn trên bộ chuyển đổi. Bạn chỉ có thể sử dụng tính năng thử nghiệm này khi bật cờ "Tính năng dành cho nhà phát triển WebGPU" tại chrome://flags/#enable-webgpu-developer-features. Hãy xem ví dụ sau và vấn đề dawn:2249.

const adapter = await navigator.gpu.requestAdapter();
const adapterInfo = await adapter.requestAdapterInfo();

for (const { size, properties } of adapterInfo.memoryHeaps) {
  console.log(size); // memory heap size in bytes
  if (properties & GPUHeapProperty.DEVICE_LOCAL)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_VISIBLE)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_COHERENT) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_UNCACHED) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_CACHED)   { /* ... */ }
}
Ảnh chụp màn hình https://webgpureport.org có các vùng nhớ khối xếp trong thông tin bộ chuyển đổi.
Vùng nhớ khối xếp thông tin của bộ chuyển đổi hiển thị trên https://webgpureport.org.

Thông tin cập nhật về Dawn

Các phương thức HasWGSLLanguageFeatureEnumerateWGSLLanguageFeatures trên wgpu::Instance đã được thêm vào để xử lý các tính năng ngôn ngữ WGSL. Xem vấn đề dawn:2260.

Tính năng wgpu::Feature::BufferMapExtendedUsages không chuẩn cho phép bạn tạo vùng đệm GPU bằng wgpu::BufferUsage::MapRead hoặc wgpu::BufferUsage::MapWrite và bất kỳ wgpu::BufferUsage nào khác. Hãy xem ví dụ sau và vấn đề dawn:2204.

wgpu::BufferDescriptor descriptor = {
  .size = 128,
  .usage = wgpu::BufferUsage::MapWrite | wgpu::BufferUsage::Uniform
};
wgpu::Buffer uniformBuffer = device.CreateBuffer(&descriptor);

uniformBuffer.MapAsync(wgpu::MapMode::Write, 0, 128,
   [](WGPUBufferMapAsyncStatus status, void* userdata)
   {
      wgpu::Buffer* buffer = static_cast<wgpu::Buffer*>(userdata);
      memcpy(buffer->GetMappedRange(), data, sizeof(data));
   },
   &uniformBuffer);

Các tính năng sau đây đã được ghi nhận: Chia sẻ hoạ tiết ANGLE, D3D11 được bảo vệ nhiều luồng, Đồng bộ hoá thiết bị ngầm ẩn, Định dạng hoạ tiết Norm16, Truy vấn dấu thời gian bên trong các lượt truyền, Bộ nhớ cục bộ của pixel, Tính năng chương trình đổ bóngĐịnh dạng nhiều mặt phẳng.

Nhóm Chrome đã tạo một kho lưu trữ GitHub chính thức cho Dawn.

Phần này chỉ đề cập đến một số điểm nổi bật chính. Hãy xem danh sách đầy đủ các thay đổi.

Tính năng mới trong WebGPU

Danh sách mọi nội dung đã được đề cập trong loạt bài Tính năng mới trong WebGPU.

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113