Tính năng mới trong WebGPU (Chrome'123)

François Beaufort
François Beaufort

Hỗ trợ các hàm tích hợp DP4a trong WGSL

DP4a (Sản phẩm nội suy của 4 phần tử và tích luỹ) là một tập hợp các lệnh GPU thường dùng trong quy trình suy luận học sâu để lượng tử hoá. Hàm này thực hiện hiệu quả tích vô hướng số nguyên 8 bit để tăng tốc tính toán các mô hình được lượng tử hoá int8 như vậy. Kiểu dữ liệu này có thể tiết kiệm (lên đến 75%) bộ nhớ và băng thông mạng, đồng thời cải thiện hiệu suất của mọi mô hình học máy trong quá trình suy luận so với phiên bản f32. Do đó, mô hình này hiện được sử dụng rộng rãi trong nhiều khung AI phổ biến.

Khi tiện ích ngôn ngữ WGSL "packed_4x8_integer_dot_product" xuất hiện trong navigator.gpu.wgslLanguageFeatures, giờ đây, bạn có thể sử dụng các đại lượng vô hướng số nguyên 32 bit đóng gói các vectơ 4 thành phần của số nguyên 8 bit làm đầu vào cho các lệnh tích vô hướng trong mã chương trình đổ bóng WGSL bằng các hàm tích hợp dot4U8Packeddot4I8Packed. Bạn cũng có thể sử dụng các lệnh đóng gói và giải nén với các vectơ 4 thành phần được đóng gói của số nguyên 8 bit bằng các hàm tích hợp WGSL pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8unpack4xU8.

Bạn nên sử dụng requires-directive để báo hiệu khả năng không thể di chuyển bằng requires packed_4x8_integer_dot_product; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và vấn đề tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Cảm ơn đặc biệt nhóm Đồ hoạ web của Intel ở Thượng Hải đã thúc đẩy việc triển khai và hoàn tất quy cách này!

Tham số con trỏ không bị hạn chế trong WGSL

Tiện ích ngôn ngữ WGSL "unrestricted_pointer_parameters" nới lỏng các quy định hạn chế về con trỏ nào có thể được truyền đến các hàm WGSL:

  • Con trỏ tham số của storage, uniformworkgroup sẽ trỏ đến các hàm do người dùng khai báo.

  • Truyền con trỏ đến các thành phần cấu trúc và phần tử mảng đến các hàm do người dùng khai báo.

Hãy xem bài viết Con trỏ dưới dạng tham số hàm | Tham quan WGSL để tìm hiểu thêm về vấn đề này.

Bạn có thể phát hiện tính năng này bằng navigator.gpu.wgslLanguageFeatures. Bạn nên luôn sử dụng requires-directive để báo hiệu khả năng không thể di chuyển bằng requires unrestricted_pointer_parameters; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau, các thay đổi về thông số kỹ thuật WGSLvấn đề tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Cú pháp đơn giản để tham chiếu giá trị tổng hợp trong WGSL

Khi tiện ích ngôn ngữ WGSL "pointer_composite_access" xuất hiện trong navigator.gpu.wgslLanguageFeatures, mã chương trình đổ bóng WGSL của bạn hiện hỗ trợ quyền truy cập vào các thành phần của các loại dữ liệu phức tạp bằng cách sử dụng cùng một cú pháp dấu chấm (.) cho dù bạn đang làm việc trực tiếp với dữ liệu hay với con trỏ đến dữ liệu đó. Cách hoạt động như sau:

  • Nếu foo là con trỏ: foo.bar là cách viết (*foo).bar thuận tiện hơn. Bạn thường cần dấu hoa thị (*) để biến con trỏ thành một "tham chiếu" có thể được gỡ tham chiếu, nhưng giờ đây, cả con trỏ và tham chiếu đều tương tự nhau hơn nhiều và gần như có thể thay thế cho nhau.

  • Nếu foo không phải là con trỏ: Toán tử dấu chấm (.) hoạt động giống như bạn thường làm để truy cập trực tiếp vào các thành viên.

Tương tự, nếu pa là con trỏ lưu trữ địa chỉ bắt đầu của một mảng, thì việc sử dụng pa[i] sẽ cho phép bạn truy cập trực tiếp vào vị trí bộ nhớ lưu trữ phần tử thứ 'i của mảng đó.

Bạn nên sử dụng requires-directive để báo hiệu khả năng không thể di chuyển bằng requires pointer_composite_access; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và issue tint:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Trạng thái chỉ có thể đọc riêng biệt cho các khía cạnh của bản in và chiều sâu

Trước đây, các tệp đính kèm độ sâu-mẫu in chỉ có thể đọc trong các lượt kết xuất yêu cầu cả hai khía cạnh (độ sâu và mẫu in) đều chỉ có thể đọc. Giới hạn này đã được gỡ bỏ. Giờ đây, bạn có thể sử dụng phương diện chiều sâu ở chế độ chỉ có thể đọc, chẳng hạn như để theo dõi bóng của vật thể tiếp xúc, trong khi vùng đệm mô hình được ghi để xác định các pixel cần xử lý thêm. Xem vấn đề dawn:2146.

Thông tin cập nhật về Dawn

Lệnh gọi lại lỗi chưa được ghi lại được đặt bằng wgpuDeviceSetUncapturedErrorCallback() hiện được gọi ngay lập tức khi lỗi xảy ra. Đây là điều mà nhà phát triển luôn mong đợi và muốn có khi gỡ lỗi. Xem thay đổi dawn:173620.

Phương thức wgpuSurfaceGetPreferredFormat() từ API webgpu.h đã được triển khai. Xem vấn đề dawn:1362.

Phần này chỉ đề cập đến một số điểm nổi bật chính. Hãy xem danh sách đầy đủ các thay đổi.

Tính năng mới trong WebGPU

Danh sách mọi nội dung đã được đề cập trong loạt bài Tính năng mới trong WebGPU.

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113