하위 그룹 실험
하위 그룹 기능은 SIMD 수준의 동시 로드를 지원하므로 그룹 내 스레드가 통신하고 집합적인 수학 연산 (예: 16개 숫자의 합계 계산)을 수행할 수 있습니다. 이는 매우 효율적인 형태의 스레드 간 데이터 공유를 제공합니다.
하위 그룹 제안의 최소 구현은 '안전하지 않은 WebGPU 지원' 뒤에서 로컬 테스트에 사용할 수 있습니다. 플래그: chrome://flags/#enable-unsafe-webgpu
오리진 트라이얼에 가입하여 실제 사용자로 사이트의 하위 그룹을 사용해 볼 수도 있습니다. 오리진 트라이얼 시작하기에서 오리진 트라이얼을 사용하기 위해 사이트를 준비하는 방법을 알아보세요. 오리진 트라이얼은 Chrome 128~131 (2025년 2월 19일까지)에서 진행됩니다. 실험 의도를 참고하세요.
GPUAdapter
에서 "subgroups"
기능을 사용할 수 있는 경우 이 기능이 포함된 GPUDevice
를 요청하여 WGSL에서 하위 그룹 지원을 받고 minSubgroupSize
및 maxSubgroupSize
제한을 확인합니다.
또한 enable subgroups;
를 사용하여 WGSL 코드에서 이 확장 프로그램을 명시적으로 사용 설정해야 합니다. 사용 설정하면 다음 항목에 액세스할 수 있습니다.
subgroup_invocation_id
: 하위 그룹 내 스레드 색인의 내장 값입니다.subgroup_size
: 하위 그룹 크기 액세스를 위한 기본 제공 값입니다.subgroupBallot(value)
:subgroup_invocation_id
에 해당하는 비트가value
이 활성 호출의 경우 true인 경우 1이고 그렇지 않은 경우 0인 비트 필드 집합을 반환합니다.subgroupBroadcast(value, id)
:id
와 일치하는subgroup_invocation_id
가 있는 호출에서 하위 그룹 내의 모든 호출에value
를 브로드캐스트합니다. 참고:id
는 컴파일-시간 상수여야 합니다.
향후 subgroupAdd
, subgroupAll
, subgroupElect
, subgroupShuffle
와 같은 기본 제공 함수가 더 추가될 예정입니다. 문제 354738715를 참고하세요.
하위 그룹 작업에서 f16을 허용하려면 "subgroups"
, "subgroups-f16"
, "shader-f16"
기능으로 GPUDevice
를 요청한 다음 enable f16, subgroups, subgroups_f16;
를 사용하여 WGSL 코드에서 사용 설정합니다.
다음 코드 스니펫은 하위 그룹을 살펴보고 그 가능성을 발견할 수 있는 기반을 제공합니다.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
선과 점의 깊이 바이어스 설정 지원 중단
WebGPU 사양 변경으로 인해 렌더링 파이프라인의 토폴로지가 선 또는 점 유형인 경우 depthBias
, depthBiasSlopeScale
, depthBiasClamp
를 0이 아닌 값으로 설정하면 유효성 검사 오류가 발생합니다. 개발자에게 코드를 업데이트할 시간을 충분히 제공하기 위해 DevTools 콘솔에 예정된 유효성 검사에 관한 경고가 표시되며, 이러한 상황에서는 값을 0으로 강제 적용합니다. 문제 352567424를 참고하세요.
preventDefault인 경우 캡처되지 않은 오류 DevTools 경고 숨기기
uncapturederror
의 이벤트 리스너가 등록되고 이벤트 preventDefault()
메서드가 이벤트 리스너 콜백 내에서 호출된 경우 DevTools 콘솔에서 uncapturederror
이벤트에 관한 경고가 더 이상 표시되지 않습니다. 이 동작은 자바스크립트의 이벤트 처리와 일치합니다. 다음 예와 문제 40263619를 참고하세요.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL은 샘플링을 먼저 보간하고
WGSL interpolate
속성을 사용하면 사용자 정의 IO 데이터 보간을 관리할 수 있습니다. 이제 새로운 보간 샘플링 매개변수 first
(기본값) 및 either
를 사용하여 추가적인 제어 기능을 사용할 수 있습니다. first
는 프리미티브의 첫 번째 꼭짓점에서 가져온 값을 사용하고 either
는 첫 번째 꼭짓점 또는 마지막 꼭짓점을 허용합니다. 문제 340278447을 참고하세요.
Dawn 업데이트
이제 비동기 작업을 처리하기 위한 Dawn의 WGPUFuture 구현이 완료되었습니다. 주요 개념으로는 상황별 이벤트 처리를 위한 wgpuInstanceProcessEvents, 콜백 위치 정의를 위한 WGPUCallbackMode가 있습니다. WGPUFuture는 수명이 무한한 일회성 이벤트를 나타내고, wgpuInstanceWaitAny는 향후 또는 시간 초과가 완료될 때까지 기다립니다. 문제 42240932를 참고하세요.
이제 CompositeAlphaMode::Auto
값은 Surface::GetCapabilities()
에 의해 보고되지 않습니다. 여전히 유효하며 Surface::GetCapabilities().alphaMode[0]
와 동일합니다. 문제 292를 참고하세요.
이제 OpenGL 백엔드가 각 Present()
호출의 y 플립 블릿과 함께 Surface
를 지원합니다. 문제 344814083을 참고하세요.
Adapter::GetProperties()
메서드가 지원 중단되고 Adapter::GetInfo()
를 사용합니다.
외부 참여자인 Jaswant가 모든 CMake 파일을 재작성하여 더 쉽게 업데이트하고 사전 빌드할 수 있도록 했습니다. CMake 프로젝트에서 Dawn을 사용하는 방법은 빠른 시작 가이드를 참고하세요.
여기에서는 몇 가지 주요 사항만 다룹니다. 전체 커밋 목록을 확인하세요.
WebGPU의 새로운 기능
WebGPU의 새로운 기능 시리즈에서 다룬 모든 내용 목록
Chrome 128
- 하위 그룹 실험
- 선 및 점의 설정 깊이 바이어스 지원 중단
- preventDefault인 경우 캡처되지 않은 오류 DevTools 경고 숨기기
- WGSL에서는 샘플링을 먼저 보간하고
- Dawn 업데이트
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
- WGSL에서 DP4a 내장 함수 지원
- WGSL의 제한되지 않은 포인터 매개변수
- WGSL에서 복합을 역참조하기 위한 구문 슈가
- 스텐실 및 깊이 측면의 별도 읽기 전용 상태
- Dawn 업데이트
Chrome 122
Chrome 121
- Android에서 WebGPU 지원
- Windows에서 셰이더 컴파일에 FXC 대신 DXC 사용
- 컴퓨팅 및 렌더링 패스의 타임스탬프 쿼리
- 셰이더 모듈의 기본 진입점
- display-p3을 GPUExternalTexture 색상 공간으로 지원
- 메모리 힙 정보
- Dawn 업데이트
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
의 HTMLImageElement 및 ImageData 지원- 읽기-쓰기 및 읽기 전용 저장소 텍스처를 실험적으로 지원합니다.
- Dawn 업데이트
Chrome 117
- 꼭짓점 버퍼 설정 해제
- 바인드 그룹 설정 해제
- 기기 분실 시 비동기 파이프라인 생성 시 오류 차단
- SPIR-V 셰이더 모듈 만들기 업데이트
- 개발자 환경 개선
- 자동으로 생성된 레이아웃으로 파이프라인 캐싱
- Dawn 업데이트
Chrome 116
- WebCodecs 통합
- GPUAdapter
requestDevice()
에서 반품한 분실 기기 importExternalTexture()
가 호출되는 경우 동영상을 원활하게 재생합니다.- 사양 적합성
- 개발자 환경 개선
- Dawn 업데이트