Hỗ trợ các hàm tích hợp DP4a trong WGSL
DP4a (Sản phẩm chấm của 4 phần tử và tích lũy) đề cập đến một tập hợp các lệnh GPU thường dùng trong suy luận học sâu để lượng tử hoá. Công cụ này thực hiện hiệu quả các sản phẩm dấu chấm số nguyên 8 bit để tăng tốc độ tính toán các mô hình lượng tử int8 như vậy. Nó có thể tiết kiệm (lên đến 75%) băng thông bộ nhớ và mạng, đồng thời cải thiện hiệu suất của bất kỳ mô hình học máy nào trong việc suy luận so với phiên bản f32 của chúng. Do đó, API này hiện được sử dụng rất nhiều trong nhiều khung AI phổ biến.
Khi có phần mở rộng về ngôn ngữ "packed_4x8_integer_dot_product"
WGSL trong navigator.gpu.wgslLanguageFeatures
, giờ đây, bạn có thể sử dụng các đại lượng vô hướng nguyên 32 bit đóng gói các vectơ 4 thành phần của số nguyên 8 bit làm dữ liệu đầu vào cho lệnh của sản phẩm dấu chấm trong mã chương trình đổ bóng WGSL bằng các hàm tích hợp dot4U8Packed
và dot4I8Packed
. Bạn cũng có thể sử dụng hướng dẫn đóng gói và giải nén bằng các vectơ 4 thành phần được đóng gói của số nguyên 8 bit với các hàm pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
và unpack4xU8
WGSL tích hợp.
Bạn nên sử dụng yêu cầu lệnh để báo hiệu khả năng không di động bằng requires packed_4x8_integer_dot_product;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và sắc thái màu của vấn đề:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Xin đặc biệt cảm ơn nhóm Đồ hoạ web của Intel tại Thượng Hải vì đã góp phần hoàn thiện quy cách và quá trình triển khai này!
Tham số con trỏ không bị hạn chế trong WGSL
Phần mở rộng ngôn ngữ "unrestricted_pointer_parameters"
WGSL nới lỏng các hạn chế về việc truyền con trỏ đến các hàm WGSL:
Con trỏ tham số của không gian địa chỉ
storage
,uniform
vàworkgroup
cho các hàm do người dùng khai báo.Truyền con trỏ đến các thành phần cấu trúc và phần tử mảng đến các hàm do người dùng khai báo.
Hãy xem bài viết Con trỏ dưới dạng tham số hàm | Tham quan WGSL để tìm hiểu thêm.
Bạn có thể phát hiện tính năng này bằng cách sử dụng navigator.gpu.wgslLanguageFeatures
. Bạn nên luôn sử dụng yêu cầu-lệnh để báo hiệu khả năng không di động bằng requires unrestricted_pointer_parameters;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau: Thay đổi về thông số kỹ thuật WGSL và sắc thái màu vấn đề:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Đường dẫn cú pháp để loại bỏ quy tắc tổng hợp trong WGSL
Khi phần mở rộng ngôn ngữ "pointer_composite_access"
WGSL xuất hiện trong navigator.gpu.wgslLanguageFeatures
, mã đổ bóng WGSL hiện hỗ trợ quyền truy cập vào các thành phần của kiểu dữ liệu phức tạp bằng cách sử dụng cùng một cú pháp dấu chấm (.
) cho dù bạn đang làm việc trực tiếp với dữ liệu hay với con trỏ. Cách hoạt động như sau:
Nếu
foo
là một con trỏ:foo.bar
là cách thuận tiện hơn để viết(*foo).bar
. Dấu hoa thị (*
) thường cần thiết để biến con trỏ thành một "tham chiếu" có thể tham chiếu được, nhưng giờ đây cả con trỏ và tham chiếu tương tự nhau hơn nhiều và gần như thay thế được cho nhau.Nếu
foo
không phải là con trỏ: Toán tử dấu chấm (.
) hoạt động giống như cách bạn thường dùng để truy cập trực tiếp vào các thành viên.
Tương tự, nếu pa
là một con trỏ lưu trữ địa chỉ bắt đầu của một mảng, thì việc sử dụng pa[i]
sẽ cho phép bạn truy cập trực tiếp vào vị trí bộ nhớ nơi lưu trữ phần tử thứ 'i
của mảng đó.
Bạn nên sử dụng yêu cầu lệnh để báo hiệu khả năng không di động bằng requires pointer_composite_access;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và sắc thái màu của vấn đề:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Tách biệt trạng thái chỉ đọc cho các thuộc tính stencil và depth
Trước đây, tệp đính kèm depth-stencil ở chế độ chỉ có thể đọc trong lượt kết xuất hình ảnh bắt buộc cả hai khía cạnh (chiều sâu và stencil) đều phải ở chế độ chỉ có thể đọc. Giới hạn này đã được gỡ bỏ. Giờ đây, bạn có thể sử dụng khía cạnh chiều sâu theo kiểu chỉ đọc, chẳng hạn như để theo dõi bóng tiếp xúc, trong khi vùng đệm stencil được ghi để xác định các pixel để xử lý thêm. Xem vấn đề buổi sáng:2146.
Cập nhật bình minh
Lệnh gọi lại lỗi chưa được thu thập được đặt bằng wgpuDeviceSetUncapturedErrorCallback()
hiện được gọi ngay khi lỗi xảy ra. Đây là điều mà các nhà phát triển luôn mong đợi và muốn gỡ lỗi. Xem phần thay đổi bình minh:173620.
Phương thức wgpuSurfaceGetPreferredFormat()
từ API webgpu.h đã được triển khai. Xem vấn đề buổi sáng:1362.
Bài viết này chỉ đề cập đến một số điểm nổi bật chính. Hãy xem danh sách các thay đổi đầy đủ.
Tính năng mới trong WebGPU
Danh sách mọi nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.
Chrome 128
- Thử nghiệm với các nhóm con
- Giảm tình trạng sai lệch độ sâu cho đường và điểm
- Ẩn cảnh báo lỗi chưa thu thập được trong Công cụ cho nhà phát triển nếu preventDefault
- WGSL nội suy lấy mẫu trước tiên rồi
- Thông tin cập nhật về bình minh
Chrome 127
- Hỗ trợ thử nghiệm cho OpenGL ES trên Android
- Thuộc tính thông tin GPU
- Cải thiện khả năng tương tác WebAssembly
- Cải thiện lỗi bộ mã hoá lệnh
- Thông tin cập nhật về bình minh
Chrome 126
- Tăng giới hạn maxTextureArrayLayers
- Tối ưu hoá quá trình tải vùng đệm lên cho phần phụ trợ Vulkan
- Cải thiện thời gian biên dịch đổ bóng
- Vùng đệm lệnh mà bạn gửi phải là duy nhất
- Thông tin cập nhật về bình minh
Chrome 125
- Nhóm con (tính năng đang được phát triển)
- Kết xuất thành lát cắt của hoạ tiết 3D
- Thông tin cập nhật về bình minh
Chrome 124
- Kết cấu bộ nhớ chỉ đọc và đọc-ghi
- Hỗ trợ trình chạy dịch vụ và nhân viên dùng chung
- Thuộc tính mới về thông tin của bộ chuyển đổi
- Sửa lỗi
- Thông tin cập nhật về bình minh
Chrome 123
- Hỗ trợ các hàm tích hợp DP4a trong WGSL
- Tham số con trỏ không bị hạn chế trong WGSL
- Đường dẫn cú pháp để loại bỏ tham chiếu của các thành phần tổng hợp trong WGSL
- Tách riêng trạng thái chỉ có thể đọc cho các khía cạnh khuôn mẫu và chiều sâu
- Thông tin cập nhật về bình minh
Chrome 122
- Mở rộng phạm vi tiếp cận bằng chế độ tương thích (tính năng đang trong quá trình phát triển)
- Tăng giới hạn maxVertexAttributes
- Thông tin cập nhật về bình minh
Chrome 121
- Hỗ trợ WebGPU trên Android
- Sử dụng DXC thay vì FXC để biên dịch chương trình đổ bóng trên Windows
- Truy vấn có dấu thời gian khi truyền dữ liệu điện toán và kết xuất
- Điểm truy cập mặc định đến mô-đun chương trình đổ bóng
- Hỗ trợ display-p3 dưới dạng hệ màu GPUExternalTexture
- Thông tin về vùng nhớ khối xếp bộ nhớ
- Thông tin cập nhật về bình minh
Chrome 120
- Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL
- Vượt giới hạn
- Thay đổi đối với trạng thái của khuôn hình theo chiều sâu
- Cập nhật thông tin về bộ chuyển đổi
- Định lượng truy vấn có dấu thời gian
- Tính năng dọn dẹp vào mùa xuân
Chrome 119
- Hoạ tiết nổi 32 bit có thể lọc
- định dạng đỉnh unorm10-10-10-2
- định dạng hoạ tiết rgb10a2uint
- Thông tin cập nhật về bình minh
Chrome 118
- Hỗ trợ HTMLImageElement và ImageData trong
copyExternalImageToTexture()
- Hỗ trợ thử nghiệm cho hoạ tiết lưu trữ chỉ đọc-ghi và chỉ đọc
- Thông tin cập nhật về bình minh
Chrome 117
- Huỷ đặt vùng đệm đỉnh
- Huỷ đặt nhóm liên kết
- Tắt tiếng lỗi của quá trình tạo quy trình không đồng bộ khi mất thiết bị
- Thông tin cập nhật về quá trình tạo mô-đun chương trình đổ bóng SPIR-V
- Cải thiện trải nghiệm của nhà phát triển
- Lưu quy trình vào bộ nhớ đệm với bố cục được tạo tự động
- Thông tin cập nhật về bình minh
Chrome 116
- Tích hợp WebCodecs
- Thiết bị bị mất do GPUAdapter
requestDevice()
trả về - Giữ cho video phát mượt mà nếu
importExternalTexture()
được gọi - Tuân thủ quy cách
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về bình minh
Chrome 115
- Các phần mở rộng ngôn ngữ WGSL được hỗ trợ
- Hỗ trợ thử nghiệm cho Direct3D 11
- Nhận GPU rời theo mặc định khi dùng nguồn AC
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về bình minh
Chrome 114
- Tối ưu hoá JavaScript
- getCurrentTexture() trên canvas chưa định cấu hình gửi InvalidStateError
- Thông tin cập nhật về WGSL
- Thông tin cập nhật về bình minh