Tính năng mới trong WebGPU (Chrome'123)

François Beaufort
François Beaufort

Hỗ trợ các hàm tích hợp DP4a trong WGSL

DP4a (Sản phẩm chấm của 4 phần tử và tích lũy) đề cập đến một tập hợp các lệnh GPU thường dùng trong suy luận học sâu để lượng tử hoá. Công cụ này thực hiện hiệu quả các sản phẩm dấu chấm số nguyên 8 bit để tăng tốc độ tính toán các mô hình lượng tử int8 như vậy. Nó có thể tiết kiệm (lên đến 75%) băng thông bộ nhớ và mạng, đồng thời cải thiện hiệu suất của bất kỳ mô hình học máy nào trong việc suy luận so với phiên bản f32 của chúng. Do đó, API này hiện được sử dụng rất nhiều trong nhiều khung AI phổ biến.

Khi có phần mở rộng về ngôn ngữ "packed_4x8_integer_dot_product" WGSL trong navigator.gpu.wgslLanguageFeatures, giờ đây, bạn có thể sử dụng các đại lượng vô hướng nguyên 32 bit đóng gói các vectơ 4 thành phần của số nguyên 8 bit làm dữ liệu đầu vào cho lệnh của sản phẩm dấu chấm trong mã chương trình đổ bóng WGSL bằng các hàm tích hợp dot4U8Packeddot4I8Packed. Bạn cũng có thể sử dụng hướng dẫn đóng gói và giải nén bằng các vectơ 4 thành phần được đóng gói của số nguyên 8 bit với các hàm pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8unpack4xU8 WGSL tích hợp.

Bạn nên sử dụng yêu cầu-lệnh để báo hiệu khả năng không di động bằng requires packed_4x8_integer_dot_product; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và sắc thái màu của vấn đề:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Xin đặc biệt cảm ơn nhóm Đồ hoạ web của Intel tại Thượng Hải vì đã góp phần hoàn thiện quy cách và quá trình triển khai này!

Tham số con trỏ không bị hạn chế trong WGSL

Phần mở rộng ngôn ngữ "unrestricted_pointer_parameters" WGSL nới lỏng các hạn chế về việc truyền con trỏ đến các hàm WGSL:

  • Con trỏ tham số của không gian địa chỉ storage, uniformworkgroup cho các hàm do người dùng khai báo.

  • Truyền con trỏ đến các thành phần cấu trúc và phần tử mảng đến các hàm do người dùng khai báo.

Hãy xem bài viết Con trỏ dưới dạng tham số hàm | Tham quan WGSL để tìm hiểu thêm.

Bạn có thể phát hiện tính năng này bằng cách sử dụng navigator.gpu.wgslLanguageFeatures. Bạn nên luôn sử dụng yêu cầu-lệnh để báo hiệu khả năng không di động bằng requires unrestricted_pointer_parameters; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau: Thay đổi về thông số kỹ thuật WGSLsắc thái màu vấn đề:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Đường dẫn cú pháp để loại bỏ quy tắc tổng hợp trong WGSL

Khi phần mở rộng ngôn ngữ "pointer_composite_access" WGSL xuất hiện trong navigator.gpu.wgslLanguageFeatures, mã đổ bóng WGSL hiện hỗ trợ quyền truy cập vào các thành phần của kiểu dữ liệu phức tạp bằng cách sử dụng cùng một cú pháp dấu chấm (.) cho dù bạn đang làm việc trực tiếp với dữ liệu hay với con trỏ. Cách hoạt động như sau:

  • Nếu foo là một con trỏ: foo.bar là cách thuận tiện hơn để viết (*foo).bar. Dấu hoa thị (*) thường cần thiết để biến con trỏ thành một "tham chiếu" có thể tham chiếu được, nhưng giờ đây cả con trỏ và tham chiếu tương tự nhau hơn nhiều và gần như thay thế được cho nhau.

  • Nếu foo không phải là con trỏ: Toán tử dấu chấm (.) hoạt động giống như cách bạn thường dùng để truy cập trực tiếp vào các thành viên.

Tương tự, nếu pa là một con trỏ lưu trữ địa chỉ bắt đầu của một mảng, thì việc sử dụng pa[i] sẽ cho phép bạn truy cập trực tiếp vào vị trí bộ nhớ nơi lưu trữ phần tử thứ 'i của mảng đó.

Bạn nên sử dụng yêu cầu lệnh để báo hiệu khả năng không di động bằng requires pointer_composite_access; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và sắc thái màu của vấn đề:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Tách biệt trạng thái chỉ đọc cho các thuộc tính stencil và depth

Trước đây, tệp đính kèm depth-stencil ở chế độ chỉ có thể đọc trong lượt kết xuất hình ảnh bắt buộc cả hai khía cạnh (chiều sâu và stencil) đều phải ở chế độ chỉ có thể đọc. Giới hạn này đã được gỡ bỏ. Giờ đây, bạn có thể sử dụng khía cạnh chiều sâu theo kiểu chỉ đọc, chẳng hạn như để theo dõi bóng tiếp xúc, trong khi vùng đệm stencil được ghi để xác định các pixel để xử lý thêm. Xem vấn đề buổi sáng:2146.

Cập nhật bình minh

Lệnh gọi lại lỗi chưa được thu thập được đặt bằng wgpuDeviceSetUncapturedErrorCallback() hiện được gọi ngay khi lỗi xảy ra. Đây là điều mà các nhà phát triển luôn mong đợi và muốn gỡ lỗi. Xem phần thay đổi buổi sáng:173620.

Phương thức wgpuSurfaceGetPreferredFormat() từ API webgpu.h đã được triển khai. Xem vấn đề buổi sáng:1362.

Bài viết này chỉ đề cập đến một số điểm nổi bật chính. Hãy xem danh sách các thay đổi đầy đủ.

Tính năng mới trong WebGPU

Danh sách mọi nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113