하위 그룹 실험
하위 그룹 기능을 사용하면 SIMD 수준 병렬 처리가 가능해 그룹 내 스레드가 통신하고 집단 수학 연산 (예: 16개 숫자의 합계 계산)을 실행할 수 있습니다. 이를 통해 매우 효율적인 교차 스레드 데이터 공유가 가능합니다.
하위 그룹 제안의 최소 구현은 chrome://flags/#enable-unsafe-webgpu
의 '안전하지 않은 WebGPU 지원' 플래그 뒤에서 로컬 테스트에 사용할 수 있습니다.
오리진 트라이얼에 가입하여 실제 사용자와 함께 사이트에서 하위 그룹을 사용해 볼 수도 있습니다. 오리진 트라이얼을 사용하도록 사이트를 준비하는 방법은 오리진 트라이얼 시작하기를 참고하세요. 오리진 트라이얼은 Chrome 128~131에서 실행됩니다 (2025년 2월 19일 종료). 실험 의도를 참고하세요.
"subgroups"
기능을 GPUAdapter
에서 사용할 수 있는 경우 이 기능으로 GPUDevice
를 요청하여 WGSL에서 하위 그룹을 지원하고 minSubgroupSize
및 maxSubgroupSize
제한을 확인합니다.
또한 WGSL 코드에서 enable subgroups;
를 사용하여 이 확장 프로그램을 명시적으로 사용 설정해야 합니다. 사용 설정하면 다음 항목에 액세스할 수 있습니다.
subgroup_invocation_id
: 하위 그룹 내 스레드의 색인에 대한 내장 값입니다.subgroup_size
: 하위 그룹 크기 액세스를 위한 내장 값입니다.subgroupBallot(value)
: 활성 호출에서value
이 참이면subgroup_invocation_id
에 해당하는 비트가 1이고 그렇지 않으면 0인 비트 필드 집합을 반환합니다.subgroupBroadcast(value, id)
:id
와 일치하는subgroup_invocation_id
를 사용하여 호출에서value
를 하위 그룹 내의 모든 호출에 브로드캐스트합니다. 참고:id
는 컴파일-시간 상수여야 합니다.
subgroupAdd
, subgroupAll
, subgroupElect
, subgroupShuffle
와 같은 기본 제공 함수가 앞으로 더 추가될 예정입니다. 문제 354738715를 참고하세요.
하위 그룹 작업에서 f16을 허용하려면 "subgroups"
, "subgroups-f16"
, "shader-f16"
기능이 있는 GPUDevice
을 요청한 다음 enable f16, subgroups, subgroups_f16;
을 사용하여 WGSL 코드에서 사용 설정하세요.
다음 코드 스니펫은 하위 그룹의 잠재력을 실험하고 발견할 수 있는 기반을 제공합니다.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
선과 점의 깊이 바이어스 설정 지원 중단
WebGPU 사양 변경으로 인해 렌더링 파이프라인의 토폴로지가 선 또는 점 유형인 경우 depthBias
, depthBiasSlopeScale
, depthBiasClamp
을 0이 아닌 값으로 설정하면 검증 오류가 발생합니다. 개발자가 코드를 업데이트할 수 있도록 충분한 시간을 주기 위해 이러한 상황에서 값을 0으로 강제하는 동시에 DevTools 콘솔에 이 예정된 유효성 검사에 관한 경고가 표시됩니다. 문제 352567424를 참고하세요.
preventDefault인 경우 포착되지 않은 오류 DevTools 경고 숨기기
uncapturederror
의 이벤트 리스너가 등록되고 이벤트 리스너 콜백 내에서 이벤트 preventDefault()
메서드가 호출된 경우 DevTools 콘솔에 uncapturederror
이벤트에 관한 경고가 더 이상 표시되지 않습니다. 이 동작은 JavaScript의 이벤트 처리와 일치합니다. 다음 예시와 문제 40263619를 참고하세요.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL 보간 샘플링이 먼저 실행되고 다음 중 하나가 실행됩니다.
WGSL interpolate
속성을 사용하면 사용자 정의 IO 데이터 보간을 관리할 수 있습니다. 이제 새로운 보간 샘플링 매개변수 first
(기본값) 및 either
를 사용하여 추가로 제어할 수 있습니다. first
는 기본 요소의 첫 번째 꼭짓점의 값을 사용하는 반면 either
는 첫 번째 또는 마지막 꼭짓점을 사용할 수 있습니다. 문제 340278447을 참고하세요.
새벽 업데이트
비동기 작업을 처리하기 위한 Dawn의 WGPUFuture 구현이 완료되었습니다. 주요 개념에는 기회적 이벤트 처리를 위한 wgpuInstanceProcessEvents와 콜백 위치 정의를 위한 WGPUCallbackMode가 포함됩니다. WGPUFuture는 수명이 무한한 일회성 이벤트를 나타내고 wgpuInstanceWaitAny는 향후 완료 또는 시간 제한을 기다립니다. 문제 42240932를 참고하세요.
이제 CompositeAlphaMode::Auto
값이 Surface::GetCapabilities()
에 의해 보고되지 않습니다. 여전히 유효하며 Surface::GetCapabilities().alphaMode[0]
와 동일합니다. 문제 292를 참고하세요.
이제 OpenGL 백엔드에서 각 Present()
호출에 y-플립 블릿을 사용하여 Surface
를 지원합니다. 문제 344814083을 참고하세요.
Adapter::GetProperties()
메서드는 Adapter::GetInfo()
사용을 위해 지원 중단되었습니다.
외부 기여자인 Jaswant가 모든 CMake 파일을 다시 작성하여 업데이트가 더 쉬워지고 사전 빌드가 가능해졌습니다. CMake 프로젝트에서 Dawn을 사용하는 방법은 빠른 시작 가이드를 참고하세요.
여기에서는 몇 가지 주요 사항만 다룹니다. 전체 커밋 목록을 확인하세요.
WebGPU의 새로운 기능
WebGPU의 새로운 기능 시리즈에서 다룬 모든 항목의 목록입니다.
Chrome 140
- 기기 요청이 어댑터를 사용함
- 텍스처 뷰가 사용되는 경우 텍스처를 사용하는 약어
- WGSL textureSampleLevel이 1D 텍스처 지원
- bgra8unorm 읽기 전용 저장소 텍스처 사용 지원 중단
- GPUAdapter isFallbackAdapter 속성 삭제
- 새벽 업데이트
Chrome 139
Chrome 138
- 버퍼를 바인딩 리소스로 사용하는 약식
- 생성 시 매핑된 버퍼의 크기 요구사항 변경
- 최근 GPU의 아키텍처 보고서
- GPUAdapter isFallbackAdapter 속성 지원 중단
- 새벽 업데이트
Chrome 137
- externalTexture 바인딩에 텍스처 뷰 사용
- 오프셋과 크기를 지정하지 않고 버퍼 복사
- 원자에 대한 포인터를 사용하는 WGSL workgroupUniformLoad
- GPUAdapterInfo powerPreference 속성
- GPURequestAdapterOptions compatibilityMode 속성 삭제
- 새벽 업데이트
Chrome 136
Chrome 135
- null 바인드 그룹 레이아웃으로 파이프라인 레이아웃 생성 허용
- 뷰포트가 렌더링 타겟 경계를 지나 확장되도록 허용
- Android에서 실험용 호환성 모드에 더 쉽게 액세스
- maxInterStageShaderComponents 한도 삭제
- 새벽 업데이트
Chrome 134
Chrome 133
- 추가 unorm8x4-bgra 및 1컴포넌트 꼭짓점 형식
- 정의되지 않은 값으로 알 수 없는 한도를 요청하도록 허용
- WGSL 정렬 규칙 변경사항
- discard를 사용한 WGSL 성능 향상
- 외부 텍스처에 VideoFrame displaySize 사용
- copyExternalImageToTexture를 사용하여 기본이 아닌 방향의 이미지 처리
- 개발자 환경 개선
- featureLevel로 호환성 모드 사용 설정
- 실험용 하위 그룹 기능 정리
- maxInterStageShaderComponents 한도 지원 중단
- 새벽 업데이트
Chrome 132
- 텍스처 뷰 사용량
- 32비트 부동 소수점 텍스처 혼합
- GPUDevice adapterInfo 속성
- 잘못된 형식으로 캔버스 컨텍스트를 구성하면 JavaScript 오류가 발생함
- 텍스처의 샘플러 제한 필터링
- 확장된 하위 그룹 실험
- 개발자 환경 개선
- 16비트 정규화된 텍스처 형식 실험적 지원
- 새벽 업데이트
Chrome 131
- WGSL에서 거리 클리핑
- GPUCanvasContext getConfiguration()
- 점 및 선 기본 요소에는 깊이 바이어스가 없어야 합니다
- 하위 그룹의 포괄적 검색 기본 제공 함수
- multi-draw indirect 실험적 지원
- 셰이더 모듈 컴파일 옵션 strict math
- GPUAdapter requestAdapterInfo() 삭제
- 새벽 업데이트
Chrome 130
Chrome 129
Chrome 128
- 하위 그룹 실험
- 선과 점의 깊이 편향 설정 지원 중단
- preventDefault인 경우 포착되지 않은 오류 DevTools 경고 숨기기
- WGSL 보간 샘플링이 먼저 실행되고 다음 중 하나가 실행됩니다.
- 새벽 업데이트
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- Android에서 WebGPU 지원
- Windows에서 셰이더 컴파일에 FXC 대신 DXC 사용
- 컴퓨팅 및 렌더링 패스의 타임스탬프 쿼리
- 셰이더 모듈의 기본 진입점
- GPUExternalTexture 색상 공간으로 display-p3 지원
- 메모리 힙 정보
- 새벽 업데이트
Chrome 120
Chrome 119
Chrome 118
Chrome 117
- 꼭짓점 버퍼 설정 해제
- 바인드 그룹 설정 해제
- 기기가 손실된 경우 비동기 파이프라인 생성에서 오류 무시
- SPIR-V 셰이더 모듈 생성 업데이트
- 개발자 환경 개선
- 자동으로 생성된 레이아웃으로 파이프라인 캐싱
- 새벽 업데이트
Chrome 116
- WebCodecs 통합
- GPUAdapter
requestDevice()
에서 반환된 손실된 기기 importExternalTexture()
이 호출되는 경우 동영상 재생을 원활하게 유지- 사양 준수
- 개발자 환경 개선
- 새벽 업데이트