Tính năng mới trong WebGPU (Chrome lúc 120)

François Beaufort
François Beaufort

Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL

Trong WGSL, loại f16 là tập hợp các giá trị dấu phẩy động 16 bit của định dạng IEEE-754 binary16 (bán độ chính xác). Điều này có nghĩa là mã này sử dụng 16 bit để biểu thị số dấu phẩy động, thay vì 32 bit cho dấu phẩy động với độ chính xác đơn thông thường (f32). Kích thước nhỏ hơn này có thể giúp cải thiện đáng kể hiệu suất, đặc biệt là khi xử lý một lượng lớn dữ liệu.

Để so sánh, trên một thiết bị Apple M1 Pro, việc triển khai f16 các mô hìnhLlama2 7B dùng trong bản minh hoạ trò chuyện trên WebLLM nhanh hơn đáng kể so với việc triển khai f32, với tốc độ điền sẵn 28% và tốc độ giải mã tăng 41% như trong các ảnh chụp màn hình sau đây.

Ảnh chụp màn hình bản minh hoạ trò chuyện của WebLLM với các mẫu Llama2 7B f32 và f16.
Bản minh hoạ trò chuyện trên WebLLM với các mô hình f32 (trái) và f16 (phải) Llama2 7B.

Không phải GPU nào cũng hỗ trợ giá trị dấu phẩy động 16 bit. Khi tính năng "shader-f16" có trong GPUAdapter, giờ đây bạn có thể yêu cầu GPUDevice với tính năng này và tạo mô-đun chương trình đổ bóng WGSL tận dụng loại dấu phẩy động có độ bán chính xác f16. Loại này chỉ hợp lệ để sử dụng trong mô-đun chương trình đổ bóng WGSL nếu bạn bật tiện ích WGSL f16 bằng enable f16;. Nếu không, createShaderModule() sẽ tạo lỗi xác thực. Hãy xem ví dụ tối thiểu sau đây và vấn đề bình minh:1510.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
  throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
  requiredFeatures: ["shader-f16"],
});

const code = `
  enable f16;

  @compute @workgroup_size(1)
  fn main() {
    const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
  }
`;

const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...

Bạn có thể hỗ trợ cả loại f16f32 trong mã mô-đun chương trình đổ bóng WGSL bằng alias tuỳ thuộc vào khả năng hỗ trợ tính năng "shader-f16", như minh hoạ trong đoạn mã sau.

const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");

const device = await adapter.requestDevice({
  requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});

const header = hasShaderF16
  ? `enable f16;
     alias min16float = f16;`
  : `alias min16float = f32;`;

const code = `
  ${header}

  @compute @workgroup_size(1)
  fn main() {
    const c = vec3<min16float>(1.0, 2.0, 3.0);
  }
`;

Phá vỡ giới hạn

Theo mặc định, số byte tối đa cần thiết để lưu một mẫu (pixel hoặc pixel phụ) của dữ liệu đầu ra quy trình kết xuất trên tất cả tệp đính kèm màu là 32 byte. Giờ đây, bạn có thể yêu cầu tối đa 64 ký tự bằng cách sử dụng giới hạn maxColorAttachmentBytesPerSample. Hãy xem ví dụ sau và vấn đề dawn:2036.

const adapter = await navigator.gpu.requestAdapter();

if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
  // When the desired limit isn't supported, take action to either fall back to
  // a code path that does not require the higher limit or notify the user that
  // their device does not meet minimum requirements.
}

// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
  requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});

Chúng tôi đã tăng giới hạn maxInterStageShaderVariablesmaxInterStageShaderComponents dùng cho hoạt động giao tiếp liên giai đoạn trên tất cả nền tảng. Xem vấn đề lúc sáng:1448 để biết chi tiết.

Đối với mỗi giai đoạn của chương trình đổ bóng, số mục tối đa của bố cục nhóm liên kết trên một bố cục quy trình là vùng đệm lưu trữ là 8 theo mặc định. Giờ đây, bạn có thể yêu cầu tối đa 10 mã bằng cách sử dụng giới hạn maxStorageBuffersPerShaderStage. Xem vấn đề buổi sáng:2159.

Đã thêm một hạn mức mới là maxBindGroupsPlusVertexBuffers. Nó bao gồm số lượng tối đa các khe nhóm liên kết và vùng đệm đỉnh được sử dụng đồng thời, tính bất kỳ khe trống nào dưới chỉ mục cao nhất. Giá trị mặc định là 24. Xem vấn đề buổi sáng:1849.

Các thay đổi đối với trạng thái depth-stencil

Để cải thiện trải nghiệm của nhà phát triển, các thuộc tính trạng thái stencil depthWriteEnableddepthCompare không còn bắt buộc nữa: depthWriteEnabled chỉ bắt buộc đối với các định dạng có chiều sâu, còn depthCompare là không bắt buộc đối với các định dạng có chiều sâu nếu không sử dụng. Xem vấn đề buổi sáng:2132.

Cập nhật thông tin về bộ chuyển đổi

Thuộc tính thông tin bộ chuyển đổi typebackend không chuẩn hiện có sẵn khi gọi requestAdapterInfo() khi người dùng bật "Tính năng dành cho nhà phát triển WebGPU" gắn cờ lúc chrome://flags/#enable-webgpu-developer-features. type có thể là "GPU rời", "GPU tích hợp", "CPU" hoặc "không xác định". backend là "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" hoặc "null". Hãy xem vấn đề bình minh:2112vấn đề lúc sáng:2107.

Ảnh chụp màn hình https://webgpureport.org nêu bật phần phụ trợ và nhập thông tin về bộ chuyển đổi.
Phần phụ trợ và loại thông tin về bộ chuyển đổi xuất hiện trên https://webgpureport.org.

Tham số danh sách unmaskHints không bắt buộc trong requestAdapterInfo() đã bị xoá. Xem vấn đề buổi sáng:1427.

Định lượng truy vấn có dấu thời gian

Truy vấn có dấu thời gian cho phép các ứng dụng đo lường thời gian thực thi của các lệnh GPU với độ chính xác nano giây. Tuy nhiên, thông số kỹ thuật của WebGPU cho phép không bắt buộc truy vấn dấu thời gian do vấn đề về tấn công theo thời gian. Nhóm Chrome tin rằng việc lượng tử hoá các truy vấn về dấu thời gian sẽ mang lại giải pháp hợp lý giữa độ chính xác và tính bảo mật, bằng cách giảm độ phân giải xuống 100 micrô giây. Xem vấn đề buổi sáng:1800.

Trong Chrome, người dùng có thể tắt tính năng định lượng dấu thời gian bằng cách bật "Tính năng dành cho nhà phát triển WebGPU" gắn cờ lúc chrome://flags/#enable-webgpu-developer-features. Lưu ý rằng chỉ riêng cờ này sẽ không bật tính năng "timestamp-query". Việc triển khai tính năng này vẫn đang trong quá trình thử nghiệm nên cần phải sử dụng dịch vụ "Hỗ trợ WebGPU không an toàn" gắn cờ lúc chrome://flags/#enable-unsafe-webgpu.

Trong Dawn, một nút bật/tắt thiết bị mới có tên là "timestamp_quantization" đã được thêm và được bật theo mặc định. Đoạn mã sau đây cho bạn biết cách cho phép "truy vấn dấu thời gian" thử nghiệm không có lượng tử dấu thời gian khi yêu cầu thiết bị.

wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};

const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;

const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = &timestampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;

wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};

// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);

Tính năng dọn dẹp vào lò xo

Thử nghiệm "timestamp-query-inside-passes" tính năng đã được đổi tên thành "chromium-experimental-timestamp-query-inside-passes" để thông báo rõ với các nhà phát triển rằng tính năng này đang trong giai đoạn thử nghiệm và hiện chỉ có trên các trình duyệt dựa trên Chromium. Xem vấn đề buổi sáng:1193.

"Truy vấn đường dẫn-số liệu thống kê" thử nghiệm Tính năng này chỉ mới triển khai một phần, đã bị xoá vì tính năng này không còn được phát triển nữa. Hãy xem phần vấn đề về chromium:1177506.

Bài viết này chỉ đề cập đến một số điểm nổi bật chính. Hãy xem danh sách các thay đổi đầy đủ.

Tính năng mới trong WebGPU

Danh sách mọi nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113