Tính năng mới trong WebGPU (Chrome lúc 120)

François Beaufort
François Beaufort

Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL

Trong WGSL, kiểu f16 là tập hợp các giá trị dấu phẩy động 16 bit của định dạng IEEE-754 binary16 (bán chính xác). Điều này có nghĩa là nó sử dụng 16 bit để biểu thị một số có dấu phẩy động, thay vì 32 bit cho số có dấu phẩy động với độ chính xác đơn thông thường (f32). Kích thước nhỏ hơn này có thể dẫn đến cải thiện đáng kể hiệu suất, đặc biệt là khi xử lý lượng lớn dữ liệu.

Để so sánh, trên thiết bị Apple M1 Pro, việc triển khai f16 của các mô hình Llama2 7B được dùng trong bản minh hoạ trò chuyện WebLLM nhanh hơn đáng kể so với việc triển khai f32, với tốc độ điền sẵn tăng 28% và tốc độ giải mã tăng 41% như minh hoạ trong các ảnh chụp màn hình sau.

Ảnh chụp màn hình bản minh hoạ trò chuyện WebLLM với các mô hình Llama2 7B f32 và f16.
Bản minh hoạ cuộc trò chuyện WebLLM với các mô hình Llama2 7B f32 (bên trái) và f16 (bên phải).

Không phải GPU nào cũng hỗ trợ các giá trị dấu phẩy động 16 bit. Khi tính năng "shader-f16" có trong GPUAdapter, giờ đây, bạn có thể yêu cầu GPUDevice có tính năng này và tạo một mô-đun chương trình đổ bóng WGSL tận dụng kiểu dấu phẩy động bán chính xác f16. Bạn chỉ có thể sử dụng loại này trong mô-đun chương trình đổ bóng WGSL nếu bật tiện ích f16 WGSL bằng enable f16;. Nếu không, createShaderModule() sẽ tạo ra một lỗi xác thực. Hãy xem ví dụ tối thiểu sau đây và vấn đề dawn:1510.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
  throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
  requiredFeatures: ["shader-f16"],
});

const code = `
  enable f16;

  @compute @workgroup_size(1)
  fn main() {
    const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
  }
`;

const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...

Bạn có thể hỗ trợ cả loại f16f32 trong mã mô-đun chương trình đổ bóng WGSL bằng alias tuỳ thuộc vào tính năng hỗ trợ "shader-f16" như minh hoạ trong đoạn mã sau.

const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");

const device = await adapter.requestDevice({
  requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});

const header = hasShaderF16
  ? `enable f16;
     alias min16float = f16;`
  : `alias min16float = f32;`;

const code = `
  ${header}

  @compute @workgroup_size(1)
  fn main() {
    const c = vec3<min16float>(1.0, 2.0, 3.0);
  }
`;

Phá vỡ giới hạn

Số lượng byte tối đa cần thiết để lưu giữ một mẫu (pixel hoặc subpixel) của dữ liệu đầu ra trong quy trình kết xuất, trên tất cả các tệp đính kèm màu, theo mặc định là 32 byte. Giờ đây, bạn có thể yêu cầu tối đa 64 bằng cách sử dụng giới hạn maxColorAttachmentBytesPerSample. Hãy xem ví dụ sau và vấn đề dawn:2036.

const adapter = await navigator.gpu.requestAdapter();

if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
  // When the desired limit isn't supported, take action to either fall back to
  // a code path that does not require the higher limit or notify the user that
  // their device does not meet minimum requirements.
}

// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
  requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});

Giới hạn maxInterStageShaderVariablesmaxInterStageShaderComponents được dùng cho hoạt động giao tiếp giữa các giai đoạn đã được tăng lên trên tất cả các nền tảng. Hãy xem vấn đề dawn:1448 để biết thông tin chi tiết.

Đối với mỗi giai đoạn đổ bóng, số lượng mục bố cục nhóm liên kết tối đa trong bố cục quy trình là 8 theo mặc định. Giờ đây, bạn có thể yêu cầu tối đa 10 bằng cách sử dụng giới hạn maxStorageBuffersPerShaderStage. Xem vấn đề dawn:2159.

Chúng tôi đã thêm một hạn mức maxBindGroupsPlusVertexBuffers mới. Số này bao gồm số lượng tối đa các khe nhóm liên kết và bộ đệm đỉnh được dùng đồng thời, tính cả mọi khe trống bên dưới chỉ mục cao nhất. Giá trị mặc định của tham số này là 24. Xem vấn đề dawn:1849.

Các thay đổi đối với trạng thái khuôn tô chiều sâu

Để cải thiện trải nghiệm của nhà phát triển, bạn không phải lúc nào cũng cần trạng thái khuôn tô chiều sâu depthWriteEnabled và các thuộc tính depthCompare nữa: depthWriteEnabled chỉ bắt buộc đối với các định dạng có chiều sâu và depthCompare không bắt buộc đối với các định dạng có chiều sâu nếu không được dùng. Xem vấn đề dawn:2132.

Nội dung cập nhật thông tin về bộ chuyển đổi

Các thuộc tính thông tin bộ chuyển đổi typebackend không theo tiêu chuẩn hiện có sẵn khi gọi requestAdapterInfo() khi người dùng đã bật cờ "WebGPU Developer Features" (Các tính năng dành cho nhà phát triển WebGPU) tại chrome://flags/#enable-webgpu-developer-features. type có thể là "GPU rời", "GPU tích hợp", "CPU" hoặc "không xác định". backend là "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" hoặc "null". Hãy xem vấn đề dawn:2112vấn đề dawn:2107.

Ảnh chụp màn hình của https://webgpureport.org có phần phụ trợ và loại trong thông tin bộ chuyển đổi.
Thông tin về bộ chuyển đổi và loại phụ trợ xuất hiện trên https://webgpureport.org.

Tham số danh sách unmaskHints không bắt buộc trong requestAdapterInfo() đã bị xoá. Xem vấn đề dawn:1427.

Lượng tử hoá truy vấn dấu thời gian

Các truy vấn dấu thời gian cho phép ứng dụng đo lường thời gian thực thi của các lệnh GPU với độ chính xác đến từng phần tỷ giây. Tuy nhiên, quy cách WebGPU không bắt buộc phải có truy vấn dấu thời gian do lo ngại về tấn công định thời. Nhóm Chrome cho rằng việc lượng tử hoá các truy vấn dấu thời gian là một giải pháp thoả hiệp hợp lý giữa độ chính xác và tính bảo mật, bằng cách giảm độ phân giải xuống 100 micrô giây. Xem vấn đề dawn:1800.

Trong Chrome, người dùng có thể tắt tính năng lượng tử hoá dấu thời gian bằng cách bật cờ "WebGPU Developer Features" (Các tính năng dành cho nhà phát triển WebGPU) tại chrome://flags/#enable-webgpu-developer-features. Xin lưu ý rằng chỉ riêng cờ này không bật tính năng "timestamp-query". Việc triển khai vẫn đang trong giai đoạn thử nghiệm và do đó, bạn cần có cờ "Hỗ trợ WebGPU không an toàn" tại chrome://flags/#enable-unsafe-webgpu.

Trong Dawn, một nút bật/tắt thiết bị mới có tên là "timestamp_quantization" đã được thêm vào và được bật theo mặc định. Đoạn mã sau đây cho biết cách cho phép tính năng thử nghiệm "timestamp-query" mà không cần định lượng dấu thời gian khi yêu cầu một thiết bị.

wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};

const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;

const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = &timestampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;

wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};

// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);

Các tính năng dọn dẹp

Tính năng thử nghiệm "timestamp-query-inside-passes" đã được đổi tên thành "chromium-experimental-timestamp-query-inside-passes" để giúp nhà phát triển biết rõ rằng tính năng này là tính năng thử nghiệm và hiện chỉ có trong các trình duyệt dựa trên Chromium. Xem vấn đề dawn:1193.

Tính năng thử nghiệm "pipeline-statistics-query" (truy vấn số liệu thống kê về quy trình) đã bị xoá vì không còn được phát triển nữa. Tính năng này chỉ được triển khai một phần. Hãy xem vấn đề chromium:1177506.

Đây chỉ là một số điểm nổi bật chính. Xem danh sách đầy đủ các cam kết.

Tính năng mới trong WebGPU

Danh sách mọi nội dung đã được đề cập trong loạt bài Tính năng mới trong WebGPU.

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113