Hỗ trợ các chức năng tích hợp DP4a trong WGSL
DP4a (Sản phẩm chấm của 4 phần tử và Tích luỹ) đề cập đến một tập hợp các lệnh về GPU thường được dùng trong suy luận học sâu để lượng tử hoá. Công cụ này thực hiện hiệu quả các sản phẩm có số nguyên 8 bit để tăng tốc việc tính toán các mô hình lượng tử hoá int8 như vậy. Nó có thể tiết kiệm (lên đến 75%) bộ nhớ và băng thông mạng, đồng thời cải thiện hiệu suất của bất kỳ mô hình học máy nào trong việc dự đoán so với phiên bản f32. Vì vậy, công nghệ này hiện được sử dụng rất nhiều trong nhiều khung AI phổ biến.
Khi phần mở rộng ngôn ngữ "packed_4x8_integer_dot_product"
WGSL có trong navigator.gpu.wgslLanguageFeatures
, bạn hiện có thể sử dụng các đại lượng vô hướng số nguyên 32 bit đóng gói các vectơ 4 thành phần của số nguyên 8 bit làm dữ liệu đầu vào cho các lệnh cho sản phẩm dấu chấm trong mã chương trình đổ bóng WGSL bằng các hàm tích hợp dot4U8Packed
và dot4I8Packed
. Bạn cũng có thể sử dụng hướng dẫn đóng gói và giải nén bằng vectơ 4 thành phần đóng gói của số nguyên 8 bit với các hàm tích hợp sẵn pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
và unpack4xU8
WGSL.
Bạn nên sử dụng lệnh yêu cầu để báo hiệu khả năng không di chuyển được bằng requires packed_4x8_integer_dot_product;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau đây và Vấn đề tông màu:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Đặc biệt cảm ơn nhóm Đồ hoạ web của Intel tại Thượng Hải vì đã hoàn thiện bản đặc tả kỹ thuật và triển khai này!
Tham số con trỏ không bị hạn chế trong WGSL
Phần mở rộng ngôn ngữ "unrestricted_pointer_parameters"
của WGSL nới lỏng các hạn chế về việc con trỏ có thể được truyền đến các hàm WGSL:
Con trỏ tham số của không gian địa chỉ
storage
,uniform
vàworkgroup
đến các hàm do người dùng khai báo.Truyền con trỏ đến các thành phần cấu trúc và phần tử mảng đến các hàm do người dùng khai báo.
Xem bài viết Con trỏ dưới dạng tham số hàm | Tìm hiểu về WGSL để tìm hiểu thêm.
Bạn có thể phát hiện tính năng này bằng navigator.gpu.wgslLanguageFeatures
. Bạn nên luôn sử dụng lệnh yêu cầu để báo hiệu khả năng không di chuyển được bằng requires unrestricted_pointer_parameters;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau: Thay đổi thông số WGSL và sắc thái màu: 2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Đường cú pháp để vô hiệu hoá thuộc tính tổng hợp trong WGSL
Khi phần mở rộng ngôn ngữ "pointer_composite_access"
WGSL có trong navigator.gpu.wgslLanguageFeatures
, mã chương trình đổ bóng WGSL của bạn hiện hỗ trợ quyền truy cập vào các thành phần của các kiểu dữ liệu phức tạp bằng cách sử dụng cùng cú pháp dấu chấm (.
) cho dù bạn đang làm việc trực tiếp với dữ liệu hay bằng con trỏ tới dữ liệu đó. Cách hoạt động như sau:
Nếu
foo
là một con trỏ:foo.bar
là cách thuận tiện hơn để ghi(*foo).bar
. Dấu hoa thị (*
) thông thường cần thiết để biến con trỏ thành "tham chiếu" có thể được tham chiếu đến, nhưng giờ đây cả con trỏ và tham chiếu đều giống nhau và gần như có thể thay thế cho nhau.Nếu
foo
không phải là con trỏ: Toán tử dấu chấm (.
) sẽ hoạt động chính xác như cách bạn thường dùng để truy cập trực tiếp vào các thành viên.
Tương tự, nếu pa
là một con trỏ lưu trữ địa chỉ bắt đầu của một mảng, thì việc sử dụng pa[i]
sẽ cho phép bạn truy cập trực tiếp vào vị trí bộ nhớ nơi lưu trữ phần tử thứ 'i
của mảng đó.
Bạn nên sử dụng lệnh yêu cầu để báo hiệu khả năng không di chuyển được bằng requires pointer_composite_access;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau đây và trang màu của lỗi:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Riêng biệt trạng thái chỉ đọc cho khía cạnh khuôn tô và chiều sâu
Trước đây, các tệp đính kèm chiều sâu chỉ đọc trong lượt kết xuất yêu cầu cả hai khía cạnh (độ sâu và khuôn tô) đều phải ở chế độ chỉ đọc. Giới hạn này đã được gỡ bỏ. Giờ đây, bạn có thể sử dụng thành phần chiều sâu ở chế độ chỉ có thể đọc để theo dõi bóng tiếp xúc, trong khi vùng đệm stencil được ghi để xác định pixel nhằm xử lý thêm. Hãy xem mục Vấn đề bình minh:2146.
Thông tin cập nhật vào Bình minh
Lệnh gọi lại lỗi không thu được được đặt bằng wgpuDeviceSetUncapturedErrorCallback()
giờ đây được gọi ngay khi lỗi xảy ra. Đây là điều mà các nhà phát triển luôn mong đợi và muốn gỡ lỗi. Xem phần thay đổi bình minh:173620.
Phương thức wgpuSurfaceGetPreferredFormat()
từ API webgpu.h đã được triển khai. Hãy xem mục Vấn đề bình minh:1362.
Bài viết này chỉ bao gồm một số điểm nổi bật chính. Xem danh sách đầy đủ các thay đổi.
Tính năng mới trong WebGPU
Danh sách tất cả nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.
Chrome 125
- Nhóm con (tính năng đang trong quá trình phát triển)
- Kết xuất thành lát của hoạ tiết 3D
- Thông tin cập nhật từ Bình minh
Chrome 124
- Kết cấu bộ nhớ chỉ đọc và đọc-ghi
- Hỗ trợ trình chạy dịch vụ và trình thực thi dùng chung
- Các thuộc tính mới về thông tin bộ chuyển đổi
- Sửa lỗi
- Thông tin cập nhật từ Bình minh
Chrome 123
- Hỗ trợ các hàm tích hợp DP4a trong WGSL
- Tham số con trỏ không bị hạn chế trong WGSL
- Đường cú pháp để loại bỏ thuộc tính tổng hợp trong WGSL
- Tách riêng trạng thái chỉ đọc cho khung viền và chiều sâu
- Thông tin cập nhật từ Bình minh
Chrome 122
- Mở rộng phạm vi tiếp cận bằng chế độ tương thích (tính năng đang trong quá trình phát triển)
- Tăng giới hạn maxVertexAttributes
- Thông tin cập nhật từ Bình minh
Chrome 121
- Hỗ trợ WebGPU trên Android
- Sử dụng DXC thay vì FXC để biên dịch chương trình đổ bóng trên Windows
- Truy vấn dấu thời gian trong thẻ điện toán và kết xuất
- Điểm truy cập mặc định đến mô-đun chương trình đổ bóng
- Hỗ trợ display-p3 dưới dạng hệ màu GPUExternalTexture
- Thông tin về vùng nhớ khối xếp
- Thông tin cập nhật từ Bình minh
Chrome 120
- Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL
- Vượt giới hạn
- Thay đổi trạng thái khuôn khổ sâu
- Cập nhật thông tin về bộ chuyển đổi
- Số lượng truy vấn dấu thời gian
- Tính năng vệ sinh lò xo
Chrome 119
- Hoạ tiết nổi 32 bit có thể lọc
- định dạng đỉnh unorm10-10-10-2
- định dạng hoạ tiết rgb10a2uint
- Thông tin cập nhật từ Bình minh
Chrome 118
- Hỗ trợ HTMLImageElement và ImageData trong
copyExternalImageToTexture()
- Hỗ trợ thử nghiệm cho hoạ tiết lưu trữ chỉ đọc và ghi
- Thông tin cập nhật từ Bình minh
Chrome 117
- Huỷ thiết lập vùng đệm đỉnh
- Huỷ thiết lập nhóm liên kết
- Tắt tiếng lỗi trong quá trình tạo quy trình không đồng bộ khi thiết bị bị mất
- Thông tin cập nhật về việc tạo mô-đun chương trình đổ bóng SPIR-V
- Cải thiện trải nghiệm của nhà phát triển
- Quy trình lưu vào bộ nhớ đệm với bố cục được tạo tự động
- Thông tin cập nhật từ Bình minh
Chrome 116
- Tích hợp WebCodecs
- Thiết bị bị mất được GPUAdapter trả về
requestDevice()
- Duy trì quá trình phát video mượt mà nếu
importExternalTexture()
được gọi - Tuân thủ thông số kỹ thuật
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật từ Bình minh
Chrome 115
- Các phần mở rộng ngôn ngữ WGSL được hỗ trợ
- Hỗ trợ thử nghiệm cho Direct3D 11
- Nhận GPU rời theo mặc định khi dùng nguồn điện xoay chiều
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật từ Bình minh
Chrome 114
- Tối ưu hoá JavaScript
- getCurrentTexture() trên canvas chưa được định cấu hình sẽ gửi InvalidStateError
- Thông tin cập nhật về WGSL
- Thông tin cập nhật từ Bình minh