Hỗ trợ các hàm tích hợp DP4a trong WGSL
DP4a (Dot Product of 4 Elements and Accumulate) đề cập đến một tập hợp các chỉ dẫn GPU thường được dùng trong suy luận học sâu để định lượng. Nó thực hiện hiệu quả tích vô hướng số nguyên 8 bit để tăng tốc quá trình tính toán các mô hình được định lượng int8 như vậy. Điều này có thể giúp tiết kiệm (tối đa 75%) bộ nhớ và băng thông mạng, đồng thời cải thiện hiệu suất của mọi mô hình học máy trong quá trình suy luận so với phiên bản f32. Do đó, hiện nay, nó được sử dụng rộng rãi trong nhiều khung AI phổ biến.
Khi tiện ích ngôn ngữ "packed_4x8_integer_dot_product"
WGSL có trong navigator.gpu.wgslLanguageFeatures
, giờ đây, bạn có thể sử dụng các đại lượng vô hướng số nguyên 32 bit đóng gói các vectơ 4 thành phần của số nguyên 8 bit làm đầu vào cho các chỉ dẫn tích của hai vectơ trong mã chương trình đổ bóng WGSL bằng các hàm tích hợp dot4U8Packed
và dot4I8Packed
. Bạn cũng có thể sử dụng hướng dẫn đóng gói và giải nén với các vectơ 4 thành phần được đóng gói gồm các số nguyên 8 bit bằng các hàm tích hợp pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
và unpack4xU8
WGSL.
Bạn nên sử dụng một requires-directive để báo hiệu khả năng không thể chuyển đổi với requires packed_4x8_integer_dot_product;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và vấn đề về màu:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Xin chân thành cảm ơn Nhóm đồ hoạ web của Intel tại Thượng Hải đã thúc đẩy việc hoàn tất quy cách và việc triển khai này!
Tham số con trỏ không hạn chế trong WGSL
Tiện ích ngôn ngữ "unrestricted_pointer_parameters"
WGSL nới lỏng các hạn chế về con trỏ có thể được truyền đến các hàm WGSL:
Con trỏ tham số của không gian địa chỉ
storage
,uniform
vàworkgroup
cho các hàm do người dùng khai báo.Truyền con trỏ đến các thành phần cấu trúc và phần tử mảng cho các hàm do người dùng khai báo.
Hãy xem Con trỏ dưới dạng tham số hàm | Chuyến tham quan WGSL để tìm hiểu thêm về vấn đề này.
Bạn có thể phát hiện tính năng này bằng cách dùng navigator.gpu.wgslLanguageFeatures
. Bạn nên luôn sử dụng một requires-directive để báo hiệu khả năng không thể chuyển đổi với requires unrestricted_pointer_parameters;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau, các thay đổi về thông số kỹ thuật WGSL và vấn đề về màu sắc:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Cú pháp đơn giản để huỷ tham chiếu các thành phần trong WGSL
Khi tiện ích ngôn ngữ "pointer_composite_access"
WGSL có trong navigator.gpu.wgslLanguageFeatures
, mã chương trình đổ bóng WGSL của bạn hiện hỗ trợ quyền truy cập vào các thành phần của kiểu dữ liệu phức tạp bằng cách sử dụng cùng một cú pháp dấu chấm (.
) cho dù bạn đang làm việc trực tiếp với dữ liệu hay với một con trỏ đến dữ liệu đó. Cách sử dụng như sau:
Nếu
foo
là một con trỏ:foo.bar
là cách thuận tiện hơn để viết(*foo).bar
. Thông thường, bạn cần dùng dấu hoa thị (*
) để biến con trỏ thành một "tham chiếu" có thể được huỷ tham chiếu, nhưng giờ đây cả con trỏ và tham chiếu đều tương tự nhau hơn nhiều và gần như có thể thay thế cho nhau.Nếu
foo
không phải là con trỏ: Toán tử dấu chấm (.
) hoạt động chính xác như bạn thường dùng để truy cập trực tiếp vào các thành phần.
Tương tự, nếu pa
là một con trỏ lưu trữ địa chỉ bắt đầu của một mảng, thì việc sử dụng pa[i]
sẽ cho phép bạn truy cập trực tiếp vào vị trí bộ nhớ nơi phần tử thứ 'i
của mảng đó được lưu trữ.
Bạn nên sử dụng một requires-directive để báo hiệu khả năng không thể chuyển đổi với requires pointer_composite_access;
ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau và vấn đề về màu sắc:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Trạng thái chỉ đọc riêng biệt cho các khía cạnh về khuôn tô và độ sâu
Trước đây, các tệp đính kèm khuôn tô chiều sâu chỉ có thể đọc trong các lượt kết xuất yêu cầu cả hai khía cạnh (chiều sâu và khuôn tô) đều chỉ có thể đọc. Hạn chế này đã được gỡ bỏ. Giờ đây, bạn có thể sử dụng khía cạnh chiều sâu ở chế độ chỉ đọc, chẳng hạn như để theo dõi bóng đổ tiếp xúc, trong khi vùng đệm khuôn được ghi để xác định các pixel cho quá trình xử lý tiếp theo. Xem vấn đề dawn:2146.
Thông tin cập nhật về bình minh
Lệnh gọi lại lỗi chưa được ghi nhận được đặt bằng wgpuDeviceSetUncapturedErrorCallback()
hiện được gọi ngay lập tức khi xảy ra lỗi. Đây là điều mà các nhà phát triển luôn mong đợi và muốn có để gỡ lỗi. Xem thay đổi dawn:173620.
Phương thức wgpuSurfaceGetPreferredFormat()
trong API webgpu.h đã được triển khai. Xem vấn đề dawn:1362.
Đây chỉ là một số điểm nổi bật chính. Xem danh sách đầy đủ các cam kết.
Tính năng mới trong WebGPU
Danh sách mọi nội dung đã được đề cập trong loạt bài Tính năng mới trong WebGPU.
Chrome 140
- Yêu cầu thiết bị sử dụng bộ điều hợp
- Cách viết tắt để sử dụng hoạ tiết khi chế độ xem hoạ tiết được dùng
- WGSL textureSampleLevel hỗ trợ kết cấu 1D
- Không dùng nữa việc sử dụng kết cấu lưu trữ chỉ đọc bgra8unorm
- Xoá thuộc tính GPUAdapter isFallbackAdapter
- Thông tin cập nhật về Dawn
Chrome 139
- Hỗ trợ kết cấu 3D cho các định dạng nén BC và ASTC
- Tính năng mới "core-features-and-limits"
- Thử nghiệm nguồn gốc cho chế độ tương thích WebGPU
- Thông tin cập nhật về Dawn
Chrome 138
- Viết tắt của việc sử dụng vùng đệm làm tài nguyên liên kết
- Thay đổi yêu cầu về kích thước đối với các vùng đệm được liên kết tại thời điểm tạo
- Báo cáo về cấu trúc cho các GPU gần đây
- Ngừng sử dụng thuộc tính GPUAdapter isFallbackAdapter
- Thông tin cập nhật về Dawn
Chrome 137
- Sử dụng khung hiển thị kết cấu để liên kết externalTexture
- Sao chép vùng đệm mà không chỉ định độ lệch và kích thước
- WGSL workgroupUniformLoad sử dụng con trỏ đến atomic
- Thuộc tính powerPreference của GPUAdapterInfo
- Xoá thuộc tính compatibilityMode của GPURequestAdapterOptions
- Thông tin cập nhật về Dawn
Chrome 136
- Thuộc tính GPUAdapterInfo isFallbackAdapter
- Cải thiện thời gian biên dịch chương trình đổ bóng trên D3D12
- Lưu và sao chép hình ảnh trên canvas
- Các quy định hạn chế đối với chế độ tương thích của Lift
- Thông tin cập nhật về Dawn
Chrome 135
- Cho phép tạo bố cục quy trình bằng bố cục nhóm liên kết rỗng
- Cho phép khung hiển thị mở rộng ra ngoài giới hạn của mục tiêu kết xuất
- Dễ dàng truy cập hơn vào chế độ tương thích thử nghiệm trên Android
- Xoá giới hạn maxInterStageShaderComponents
- Thông tin cập nhật về Dawn
Chrome 134
- Cải thiện khối lượng công việc học máy bằng các nhóm con
- Xoá chế độ hỗ trợ các loại kết cấu có thể lọc dấu phẩy động dưới dạng kết hợp
- Thông tin cập nhật về Dawn
Chrome 133
- Các định dạng đỉnh 1 thành phần và unorm8x4-bgra khác
- Cho phép yêu cầu các giới hạn không xác định bằng giá trị không xác định
- Thay đổi quy tắc căn chỉnh WGSL
- Tăng hiệu suất WGSL bằng cách loại bỏ
- Sử dụng VideoFrame displaySize cho các hoạ tiết bên ngoài
- Xử lý hình ảnh có hướng không mặc định bằng copyExternalImageToTexture
- Cải thiện trải nghiệm của nhà phát triển
- Bật chế độ tương thích bằng featureLevel
- Dọn dẹp các tính năng thử nghiệm của nhóm con
- Ngừng sử dụng giới hạn maxInterStageShaderComponents
- Thông tin cập nhật về Dawn
Chrome 132
- Cách sử dụng khung hiển thị kết cấu
- Kết hợp hoạ tiết dấu phẩy động 32 bit
- Thuộc tính adapterInfo của GPUDevice
- Định cấu hình ngữ cảnh canvas bằng định dạng không hợp lệ sẽ gây ra lỗi JavaScript
- Lọc các hạn chế về bộ lấy mẫu trên kết cấu
- Thử nghiệm nhóm con mở rộng
- Cải thiện trải nghiệm của nhà phát triển
- Hỗ trợ thử nghiệm cho các định dạng hoạ tiết được chuẩn hoá 16 bit
- Thông tin cập nhật về Dawn
Chrome 131
- Khoảng cách cắt trong WGSL
- GPUCanvasContext getConfiguration()
- Các thành phần cơ bản của điểm và đường không được có độ lệch về độ sâu
- Các hàm tích hợp quét toàn diện cho các nhóm nhỏ
- Hỗ trợ thử nghiệm cho tính năng vẽ gián tiếp nhiều lần
- Lựa chọn biên dịch mô-đun chương trình đổ bóng strict math
- Xoá GPUAdapter requestAdapterInfo()
- Thông tin cập nhật về Dawn
Chrome 130
- Kết hợp hai nguồn
- Cải thiện thời gian biên dịch chương trình đổ bóng trên Metal
- Ngừng sử dụng requestAdapterInfo() của GPUAdapter
- Thông tin cập nhật về Dawn
Chrome 129
Chrome 128
- Thử nghiệm với các nhóm nhỏ
- Không dùng chế độ đặt độ lệch độ sâu cho đường thẳng và điểm
- Ẩn cảnh báo Công cụ cho nhà phát triển về lỗi chưa được ghi lại nếu preventDefault
- WGSL nội suy lấy mẫu trước và một trong hai
- Thông tin cập nhật về Dawn
Chrome 127
- Hỗ trợ thử nghiệm cho OpenGL ES trên Android
- Thuộc tính thông tin GPUAdapter
- Cải thiện khả năng tương tác của WebAssembly
- Cải thiện lỗi bộ mã hoá lệnh
- Thông tin cập nhật về Dawn
Chrome 126
- Tăng giới hạn maxTextureArrayLayers
- Tối ưu hoá quá trình tải vùng đệm lên cho phần phụ trợ Vulkan
- Cải thiện thời gian biên dịch chương trình đổ bóng
- Các vùng đệm lệnh đã gửi phải là duy nhất
- Thông tin cập nhật về Dawn
Chrome 125
Chrome 124
- Kết cấu bộ nhớ chỉ đọc và đọc-ghi
- Hỗ trợ service worker và shared worker
- Thuộc tính thông tin mới về bộ chuyển đổi
- Sửa lỗi
- Thông tin cập nhật về Dawn
Chrome 123
- Hỗ trợ các hàm tích hợp DP4a trong WGSL
- Các tham số con trỏ không bị hạn chế trong WGSL
- Cú pháp đơn giản để huỷ tham chiếu các thành phần trong WGSL
- Trạng thái chỉ đọc riêng biệt cho các khía cạnh khuôn tô và độ sâu
- Thông tin cập nhật về Dawn
Chrome 122
- Mở rộng phạm vi tiếp cận bằng chế độ tương thích (tính năng đang được phát triển)
- Tăng giới hạn maxVertexAttributes
- Thông tin cập nhật về Dawn
Chrome 121
- Hỗ trợ WebGPU trên Android
- Sử dụng DXC thay vì FXC để biên dịch chương trình đổ bóng trên Windows
- Truy vấn dấu thời gian trong các lượt tính toán và kết xuất
- Điểm truy cập mặc định vào các mô-đun chương trình đổ bóng
- Hỗ trợ display-p3 làm không gian màu GPUExternalTexture
- Thông tin về vùng nhớ heap
- Thông tin cập nhật về Dawn
Chrome 120
- Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL
- Phá vỡ giới hạn
- Các thay đổi đối với trạng thái khuôn tô chiều sâu
- Thông tin cập nhật về bộ chuyển đổi
- Lượng tử hoá truy vấn dấu thời gian
- Các tính năng dọn dẹp đón mùa xuân
Chrome 119
- Kết cấu dấu phẩy động 32 bit có thể lọc
- định dạng đỉnh unorm10-10-10-2
- Định dạng hoạ tiết rgb10a2uint
- Thông tin cập nhật về Dawn
Chrome 118
- Hỗ trợ HTMLImageElement và ImageData trong
copyExternalImageToTexture()
- Hỗ trợ thử nghiệm cho hoạ tiết lưu trữ chỉ đọc và đọc-ghi
- Thông tin cập nhật về Dawn
Chrome 117
- Huỷ thiết lập vùng đệm đỉnh
- Huỷ đặt nhóm liên kết
- Không hiển thị lỗi khi tạo quy trình không đồng bộ nếu thiết bị bị mất
- Thông tin cập nhật về việc tạo mô-đun chương trình đổ bóng SPIR-V
- Cải thiện trải nghiệm của nhà phát triển
- Các quy trình lưu vào bộ nhớ đệm có bố cục được tạo tự động
- Thông tin cập nhật về Dawn
Chrome 116
- Tích hợp WebCodecs
- Thiết bị bị mất do GPUAdapter
requestDevice()
trả về - Duy trì chế độ phát video mượt mà nếu
importExternalTexture()
được gọi - Sự tuân thủ quy cách
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về Dawn
Chrome 115
- Các tiện ích ngôn ngữ WGSL được hỗ trợ
- Hỗ trợ thử nghiệm cho Direct3D 11
- Nhận GPU rời theo mặc định khi dùng nguồn điện AC
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về Dawn
Chrome 114
- Tối ưu hoá JavaScript
- getCurrentTexture() trên canvas chưa thiết lập sẽ gửi InvalidStateError
- Thông tin cập nhật về WGSL
- Thông tin cập nhật về Dawn