Thử nghiệm với các nhóm con
Tính năng nhóm con cho phép tính song song cấp SIMD, cho phép các luồng trong một nhóm giao tiếp và thực hiện các phép toán tập thể (ví dụ: tính tổng 16 số). Đây là một hình thức chia sẻ dữ liệu trên nhiều luồng mang lại hiệu quả cao.
Hiện đã có cách triển khai tối thiểu cho đề xuất về nhóm con để kiểm thử cục bộ phía sau dịch vụ "Hỗ trợ WebGPU không an toàn" gắn cờ lúc chrome://flags/#enable-unsafe-webgpu
.
Bạn cũng có thể thử các nhóm con trên trang web của mình với những người dùng thực sự bằng cách đăng ký bản dùng thử theo nguyên gốc. Hãy đọc bài viết Làm quen với bản dùng thử theo nguyên gốc để xem hướng dẫn về cách chuẩn bị trang web để sử dụng bản dùng thử theo nguyên gốc. Bản dùng thử theo nguyên gốc sẽ chạy từ Chrome 128 đến 131 (kết thúc vào ngày 19 tháng 2 năm 2025). Xem phần Ý định thử nghiệm.
Khi tính năng "subgroups"
có trong GPUAdapter
, hãy yêu cầu GPUDevice
bằng tính năng này để được hỗ trợ cho các nhóm con trong WGSL, đồng thời kiểm tra các giới hạn minSubgroupSize
và maxSubgroupSize
của tính năng này.
Bạn cũng cần bật tiện ích này một cách rõ ràng trong mã WGSL bằng enable subgroups;
. Khi bật tính năng này, bạn sẽ có quyền truy cập vào những tính năng bổ sung sau:
subgroup_invocation_id
: Một giá trị tích hợp sẵn cho chỉ mục của luồng trong nhóm con.subgroup_size
: Một giá trị tích hợp sẵn để truy cập vào quy mô nhóm con.subgroupBallot(value)
: Trả về một tập hợp các trường bit, trong đó bit tương ứng vớisubgroup_invocation_id
là 1 nếuvalue
đúng với lệnh gọi đang hoạt động đó và bằng 0 nếu ngược lại.subgroupBroadcast(value, id)
: Truyền phátvalue
từ lệnh gọi cósubgroup_invocation_id
khớp vớiid
đến tất cả lệnh gọi trong nhóm con. Lưu ý:id
phải là hằng số thời gian biên dịch.
Trong tương lai, chúng tôi sẽ thêm các hàm tích hợp khác như subgroupAdd
, subgroupAll
, subgroupElect
, subgroupShuffle
. Xem vấn đề 354738715.
Để cho phép f16 trong các hoạt động của nhóm con, hãy yêu cầu GPUDevice
bằng các tính năng "subgroups"
, "subgroups-f16"
và "shader-f16"
, sau đó bật thuộc tính này trong mã WGSL bằng enable f16, subgroups, subgroups_f16;
.
Đoạn mã sau đây cung cấp cơ sở để tra cứu và khám phá tiềm năng của các nhóm con.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Ngừng cài đặt độ lệch độ sâu cho các đường và điểm
Việc thay đổi thông số kỹ thuật WebGPU sẽ khiến việc đặt depthBias
, depthBiasSlopeScale
và depthBiasClamp
thành một giá trị khác 0 khi cấu trúc liên kết của quy trình kết xuất là một loại đường hoặc điểm. Để nhà phát triển có đủ thời gian cập nhật mã của họ, một cảnh báo trong Bảng điều khiển công cụ cho nhà phát triển sẽ hiển thị về lần xác thực sắp tới này, đồng thời buộc các giá trị về 0 trong những trường hợp này. Xem vấn đề 352567424.
Ẩn cảnh báo lỗi chưa thu thập được trong Công cụ cho nhà phát triển nếu preventDefault
Trong Bảng điều khiển Công cụ cho nhà phát triển, cảnh báo đối với các sự kiện uncapturederror
sẽ không còn hiển thị nếu trình nghe sự kiện cho uncapturederror
đã được đăng ký và phương thức preventDefault()
Sự kiện đã được gọi trong lệnh gọi lại trình nghe sự kiện. Hành vi này khớp với cách xử lý sự kiện trong JavaScript. Hãy xem ví dụ sau và vấn đề 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL nội suy lấy mẫu trước tiên và
Thuộc tính interpolate
WGSL cho phép bạn quản lý nội suy dữ liệu IO do người dùng xác định. Giờ đây, các tham số lấy mẫu nội suy mới first
(mặc định) và either
sẽ cung cấp cho bạn thêm quyền kiểm soát: first
dùng giá trị từ đỉnh đầu tiên của dữ liệu nguyên gốc, còn either
cho phép đỉnh đầu tiên hoặc đỉnh cuối cùng. Xem vấn đề 340278447.
Cập nhật bình minh
Hiện đã hoàn tất việc triển khai WGPUFuture của Dawn để xử lý các hoạt động không đồng bộ. Các khái niệm chính bao gồm wgpuInstanceProcessEvents để xử lý sự kiện cơ hội và WGPUCallbackMode để xác định vị trí gọi lại. WGPUFuture biểu thị các sự kiện xảy ra một lần có thời gian tồn tại vô hạn và wgpuInstanceWaitAny chờ hoàn tất sau một tương lai hoặc một thời gian chờ bất kỳ. Xem vấn đề 42240932.
Giá trị CompositeAlphaMode::Auto
hiện chưa được Surface::GetCapabilities()
báo cáo. Hàm này vẫn hợp lệ và tương đương với Surface::GetCapabilities().alphaMode[0]
. Xem vấn đề 292.
Phần phụ trợ OpenGL hiện hỗ trợ Surface
với cửa sổ bật tắt y-flip cho mỗi lệnh gọi Present()
. Xem vấn đề 344814083.
Phương thức Adapter::GetProperties()
không còn được dùng nữa và thay vào đó là sử dụng Adapter::GetInfo()
.
Jaswant, một cộng tác viên bên ngoài, đã viết lại tất cả các tệp CMake, giúp cập nhật và cho phép các bản dựng sẵn trở nên dễ dàng hơn. Xem hướng dẫn bắt đầu nhanh để sử dụng Dawn trong các dự án CMake.
Bài viết này chỉ đề cập đến một số điểm nổi bật chính. Hãy xem danh sách các thay đổi đầy đủ.
Tính năng mới trong WebGPU
Danh sách mọi nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.
Chrome 128
- Thử nghiệm với các nhóm con
- Giảm tình trạng sai lệch độ sâu cho đường và điểm
- Ẩn cảnh báo lỗi chưa thu thập được trong Công cụ cho nhà phát triển nếu preventDefault
- WGSL nội suy lấy mẫu trước tiên rồi
- Thông tin cập nhật về bình minh
Chrome 127
- Hỗ trợ thử nghiệm cho OpenGL ES trên Android
- Thuộc tính thông tin GPU
- Cải thiện khả năng tương tác WebAssembly
- Cải thiện lỗi bộ mã hoá lệnh
- Thông tin cập nhật về bình minh
Chrome 126
- Tăng giới hạn maxTextureArrayLayers
- Tối ưu hoá quá trình tải vùng đệm lên cho phần phụ trợ Vulkan
- Cải thiện thời gian biên dịch đổ bóng
- Vùng đệm lệnh mà bạn gửi phải là duy nhất
- Thông tin cập nhật về bình minh
Chrome 125
- Nhóm con (tính năng đang được phát triển)
- Kết xuất thành lát cắt của hoạ tiết 3D
- Thông tin cập nhật về bình minh
Chrome 124
- Kết cấu bộ nhớ chỉ đọc và đọc-ghi
- Hỗ trợ trình chạy dịch vụ và nhân viên dùng chung
- Thuộc tính mới về thông tin của bộ chuyển đổi
- Sửa lỗi
- Thông tin cập nhật về bình minh
Chrome 123
- Hỗ trợ các hàm tích hợp DP4a trong WGSL
- Tham số con trỏ không bị hạn chế trong WGSL
- Đường dẫn cú pháp để loại bỏ tham chiếu của các thành phần tổng hợp trong WGSL
- Tách riêng trạng thái chỉ có thể đọc cho các khía cạnh khuôn mẫu và chiều sâu
- Thông tin cập nhật về bình minh
Chrome 122
- Mở rộng phạm vi tiếp cận bằng chế độ tương thích (tính năng đang trong quá trình phát triển)
- Tăng giới hạn maxVertexAttributes
- Thông tin cập nhật về bình minh
Chrome 121
- Hỗ trợ WebGPU trên Android
- Sử dụng DXC thay vì FXC để biên dịch chương trình đổ bóng trên Windows
- Truy vấn có dấu thời gian khi truyền dữ liệu điện toán và kết xuất
- Điểm truy cập mặc định đến mô-đun chương trình đổ bóng
- Hỗ trợ display-p3 dưới dạng hệ màu GPUExternalTexture
- Thông tin về vùng nhớ khối xếp bộ nhớ
- Thông tin cập nhật về bình minh
Chrome 120
- Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL
- Vượt giới hạn
- Thay đổi đối với trạng thái của khuôn hình theo chiều sâu
- Cập nhật thông tin về bộ chuyển đổi
- Định lượng truy vấn có dấu thời gian
- Tính năng dọn dẹp vào mùa xuân
Chrome 119
- Hoạ tiết nổi 32 bit có thể lọc
- định dạng đỉnh unorm10-10-10-2
- định dạng hoạ tiết rgb10a2uint
- Thông tin cập nhật về bình minh
Chrome 118
- Hỗ trợ HTMLImageElement và ImageData trong
copyExternalImageToTexture()
- Hỗ trợ thử nghiệm cho hoạ tiết lưu trữ chỉ đọc-ghi và chỉ đọc
- Thông tin cập nhật về bình minh
Chrome 117
- Huỷ đặt vùng đệm đỉnh
- Huỷ đặt nhóm liên kết
- Tắt tiếng lỗi của quá trình tạo quy trình không đồng bộ khi mất thiết bị
- Thông tin cập nhật về quá trình tạo mô-đun chương trình đổ bóng SPIR-V
- Cải thiện trải nghiệm của nhà phát triển
- Lưu quy trình vào bộ nhớ đệm với bố cục được tạo tự động
- Thông tin cập nhật về bình minh
Chrome 116
- Tích hợp WebCodecs
- Thiết bị bị mất do GPUAdapter
requestDevice()
trả về - Giữ cho video phát mượt mà nếu
importExternalTexture()
được gọi - Tuân thủ quy cách
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về bình minh
Chrome 115
- Các phần mở rộng ngôn ngữ WGSL được hỗ trợ
- Hỗ trợ thử nghiệm cho Direct3D 11
- Nhận GPU rời theo mặc định khi dùng nguồn AC
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật về bình minh
Chrome 114
- Tối ưu hoá JavaScript
- getCurrentTexture() trên canvas chưa định cấu hình gửi InvalidStateError
- Thông tin cập nhật về WGSL
- Thông tin cập nhật về bình minh