Hỗ trợ các hàm tích hợp DP4a trong WGSL
DP4a (Sản phẩm nội suy của 4 phần tử và tích luỹ) là một tập hợp các lệnh GPU thường được dùng trong quy trình suy luận học sâu để lượng tử hoá. Phương thức này thực hiện hiệu quả tích vô hướng số nguyên 8 bit để tăng tốc tính toán các mô hình được lượng tử hoá int8 như vậy. Nó có thể tiết kiệm (lên đến 75%) băng thông bộ nhớ và mạng, đồng thời cải thiện hiệu suất của bất kỳ mô hình học máy nào trong việc suy luận so với phiên bản f32 của chúng. Do đó, hiện tại, mô hình này được sử dụng rộng rãi trong nhiều khung AI phổ biến.
Khi tiện ích ngôn ngữ WGSL "packed_4x8_integer_dot_product"
có trong navigator.gpu.wgslLanguageFeatures
, giờ đây, bạn có thể sử dụng các đại lượng vô hướng số nguyên 32 bit đóng gói các vectơ 4 thành phần của số nguyên 8 bit làm dữ liệu đầu vào cho các lệnh tích vô hướng trong mã chương trình đổ bóng WGSL bằng các hàm tích hợp dot4U8Packed
và dot4I8Packed
. Bạn cũng có thể sử dụng các hướng dẫn đóng gói và giải nén bằng các vectơ 4 thành phần được đóng gói của số nguyên 8 bit với các hàm tích hợp WGSL pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
và unpack4xU8
.
Bạn nên sử dụng yêu cầu-lệnh để báo hiệu khả năng không di động bằng requires packed_4x8_integer_dot_product;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và vấn đề tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Xin đặc biệt cảm ơn nhóm Đồ hoạ web của Intel tại Thượng Hải vì đã góp phần hoàn thiện quy cách và quá trình triển khai này!
Tham số con trỏ không bị hạn chế trong WGSL
Tiện ích ngôn ngữ WGSL "unrestricted_pointer_parameters"
nới lỏng các quy định hạn chế về con trỏ nào có thể được truyền đến các hàm WGSL:
Con trỏ tham số của
storage
,uniform
vàworkgroup
sẽ trỏ đến các hàm do người dùng khai báo.Truyền con trỏ đến các thành phần cấu trúc và phần tử mảng đến các hàm do người dùng khai báo.
Hãy xem bài viết Con trỏ dưới dạng tham số hàm | Tham quan WGSL để tìm hiểu thêm.
Bạn có thể phát hiện tính năng này bằng navigator.gpu.wgslLanguageFeatures
. Bạn nên luôn sử dụng requires-directive để báo hiệu khả năng không thể di chuyển bằng requires unrestricted_pointer_parameters;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau, các thay đổi về thông số kỹ thuật WGSL và vấn đề tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Cú pháp đơn giản để tham chiếu giá trị tổng hợp trong WGSL
Khi tiện ích ngôn ngữ WGSL "pointer_composite_access"
xuất hiện trong navigator.gpu.wgslLanguageFeatures
, mã chương trình đổ bóng WGSL của bạn hiện hỗ trợ quyền truy cập vào các thành phần của các loại dữ liệu phức tạp bằng cách sử dụng cùng một cú pháp dấu chấm (.
) cho dù bạn đang làm việc trực tiếp với dữ liệu hay với con trỏ đến dữ liệu đó. Cách hoạt động như sau:
Nếu
foo
là con trỏ:foo.bar
là cách viết(*foo).bar
thuận tiện hơn. Bạn thường cần dấu hoa thị (*
) để biến con trỏ thành một "tham chiếu" có thể được gỡ tham chiếu, nhưng giờ đây, cả con trỏ và tham chiếu đều tương tự nhau hơn nhiều và gần như có thể thay thế cho nhau.Nếu
foo
không phải là con trỏ: Toán tử dấu chấm (.
) hoạt động giống như bạn thường làm để truy cập trực tiếp vào các thành viên.
Tương tự, nếu pa
là con trỏ lưu trữ địa chỉ bắt đầu của một mảng, thì việc sử dụng pa[i]
sẽ cho phép bạn truy cập trực tiếp vào vị trí bộ nhớ lưu trữ phần tử thứ 'i
của mảng đó.
Bạn nên sử dụng requires-directive để báo hiệu khả năng không thể di chuyển bằng requires pointer_composite_access;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và issue tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Trạng thái chỉ có thể đọc riêng biệt cho các khía cạnh của bản in và chiều sâu
Trước đây, các tệp đính kèm độ sâu-mẫu in chỉ có thể đọc trong các lượt kết xuất yêu cầu cả hai khía cạnh (độ sâu và mẫu in) đều chỉ có thể đọc. Giới hạn này đã được gỡ bỏ. Giờ đây, bạn có thể sử dụng phương diện chiều sâu ở chế độ chỉ có thể đọc, chẳng hạn như để theo dõi bóng của vật thể tiếp xúc, trong khi vùng đệm mô hình được ghi để xác định các pixel cần xử lý thêm. Xem vấn đề buổi sáng:2146.
Thông tin cập nhật về Dawn
Lệnh gọi lại lỗi chưa được ghi lại được đặt bằng wgpuDeviceSetUncapturedErrorCallback()
hiện được gọi ngay lập tức khi lỗi xảy ra. Đây là điều mà nhà phát triển luôn mong đợi và muốn có khi gỡ lỗi. Xem thay đổi dawn:173620.
Phương thức wgpuSurfaceGetPreferredFormat()
từ API webgpu.h đã được triển khai. Xem vấn đề dawn:1362.
Bài viết này chỉ đề cập đến một số điểm nổi bật chính. Hãy xem danh sách đầy đủ các thay đổi.
Tính năng mới trong WebGPU
Danh sách mọi nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.
Chrome 131
- Đoạn video khoảng cách trong WGSL
- GPUCanvasContext getConfiguration()
- Các đối tượng gốc điểm và đường không được có độ lệch sâu
- Hàm tích hợp quét toàn diện cho các nhóm con
- Hỗ trợ thử nghiệm cho nhiều bản vẽ gián tiếp
- Tuỳ chọn biên dịch mô-đun đổ bóng toán học nghiêm ngặt
- Xoá GPUAdapter requestAdapterInfo()
- Thông tin cập nhật về bình minh
Chrome 130
- Hỗn hợp nguồn kép
- Cải thiện thời gian biên dịch chương trình đổ bóng trên Metal
- Ngừng sử dụng GPUAdapter requestAdapterInfo()
- Thông tin cập nhật về Dawn
Chrome 129
- Hỗ trợ HDR bằng chế độ ánh xạ tông màu canvas
- Mở rộng tính năng hỗ trợ nhóm con
- Thông tin cập nhật về Dawn
Chrome 128
- Thử nghiệm với các nhóm con
- Ngừng sử dụng tính năng đặt độ lệch chiều sâu cho các đường và điểm
- Ẩn cảnh báo Công cụ cho nhà phát triển về lỗi không được ghi lại nếu preventDefault
- WGSL nội suy lấy mẫu trước và
- Thông tin cập nhật về bình minh
Chrome 127
- Hỗ trợ thử nghiệm cho OpenGL ES trên Android
- Thuộc tính thông tin GPUAdapter
- Cải tiến khả năng tương tác của WebAssembly
- Cải thiện lỗi bộ mã hoá lệnh
- Thông tin cập nhật về Dawn
Chrome 126
- Tăng giới hạn maxTextureArrayLayers
- Tối ưu hoá tính năng tải vùng đệm lên cho phần phụ trợ Vulkan
- Cải thiện thời gian biên dịch chương trình đổ bóng
- Vùng đệm lệnh đã gửi phải là duy nhất
- Thông tin cập nhật về Dawn
Chrome 125
- Nhóm con (tính năng đang được phát triển)
- Hiển thị lát cắt của hoạ tiết 3D
- Thông tin cập nhật về Dawn
Chrome 124
- Kết cấu bộ nhớ chỉ đọc và đọc-ghi
- Hỗ trợ worker và worker dùng chung
- Các thuộc tính thông tin mới của bộ chuyển đổi
- Sửa lỗi
- Thông tin cập nhật về Dawn
Chrome 123
- Hỗ trợ các hàm tích hợp DP4a trong WGSL
- Tham số con trỏ không bị hạn chế trong WGSL
- Cú pháp đơn giản để huỷ tham chiếu các thành phần kết hợp trong WGSL
- Tách riêng trạng thái chỉ có thể đọc cho các khía cạnh khuôn mẫu và chiều sâu
- Thông tin cập nhật về Dawn
Chrome 122
- Mở rộng phạm vi tiếp cận bằng chế độ tương thích (tính năng đang trong quá trình phát triển)
- Tăng giới hạn maxVertexAttributes
- Thông tin cập nhật về Dawn
Chrome 121
- Hỗ trợ WebGPU trên Android
- Sử dụng DXC thay vì FXC để biên dịch chương trình đổ bóng trên Windows
- Truy vấn có dấu thời gian khi truyền dữ liệu điện toán và kết xuất
- Điểm truy cập mặc định đến mô-đun chương trình đổ bóng
- Hỗ trợ display-p3 làm không gian màu GPUExternalTexture
- Thông tin về vùng nhớ khối xếp
- Thông tin cập nhật về Dawn
Chrome 120
- Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL
- Phá vỡ giới hạn
- Thay đổi đối với trạng thái chiều sâu-khung đệm
- Cập nhật thông tin về bộ chuyển đổi
- Định lượng truy vấn dấu thời gian
- Các tính năng dọn dẹp mùa xuân
Chrome 119
- Hoạ tiết dấu phẩy động 32 bit có thể lọc
- Định dạng đỉnh unorm10-10-10-2
- Định dạng hoạ tiết rgb10a2uint
- Thông tin cập nhật về Dawn
Chrome 118
- Hỗ trợ HTMLImageElement và ImageData trong
copyExternalImageToTexture()
- Hỗ trợ thử nghiệm cho hoạ tiết bộ nhớ đọc-ghi và chỉ đọc
- Thông tin cập nhật về Dawn
Chrome 117
- Huỷ đặt vùng đệm đỉnh
- Huỷ đặt nhóm liên kết
- Loại bỏ lỗi khi tạo quy trình không đồng bộ khi thiết bị bị mất
- Thông tin cập nhật về việc tạo mô-đun chương trình đổ bóng SPIR-V
- Cải thiện trải nghiệm của nhà phát triển
- Lưu các quy trình vào bộ nhớ đệm bằng bố cục được tạo tự động
- Thông tin cập nhật về bình minh
Chrome 116
- Tích hợp WebCodecs
- Thiết bị bị mất do GPUAdapter
requestDevice()
trả về - Giữ cho quá trình phát video diễn ra mượt mà nếu
importExternalTexture()
được gọi - Tuân thủ quy cách
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về Dawn
Chrome 115
- Các phần mở rộng ngôn ngữ WGSL được hỗ trợ
- Hỗ trợ thử nghiệm cho Direct3D 11
- Nhận GPU rời theo mặc định khi dùng nguồn AC
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về Dawn
Chrome 114
- Tối ưu hoá JavaScript
- getCurrentTexture() trên canvas chưa định cấu hình gửi InvalidStateError
- Nội dung cập nhật về WGSL
- Thông tin cập nhật về bình minh