게시일: 2025년 2월 26일
하위 그룹으로 머신러닝 워크로드 개선
1년간의 개발과 시험을 거쳐 SIMD 수준의 병렬 처리를 지원하는 하위 그룹 WebGPU 기능을 사용할 수 있습니다. 이를 통해 워크그룹의 스레드가 통신하고 숫자의 합계를 계산하는 등의 집단 수학 연산을 실행할 수 있으며 스레드 간 데이터 공유를 위한 효율적인 방법을 제공합니다. 원래 제안서 및 chromestatus 항목을 참고하세요.
참고로 Google Meet에서는 오리진 트라이얼 중에 일부 기기에서 행렬-벡터 곱셈 셰이더의 패킹된 정수 점곱에 대해 하위 그룹을 벤치마킹할 때 속도가 2.3~2.9배 증가했습니다.
"subgroups"
기능을 GPUAdapter
에서 사용할 수 있는 경우 이 기능으로 GPUDevice
을 요청하여 WGSL에서 하위 그룹을 지원받습니다. 특정 크기의 하위 그룹이 필요한 하드코딩된 알고리즘이 있는 경우 subgroupMinSize
및 subgroupMaxSize
어댑터 정보 값을 확인하는 것이 좋습니다.
컴퓨팅 및 프래그먼트 셰이더 단계에서 다음 내장 값에 액세스하려면 enable subgroups;
를 사용하여 WGSL 코드에서 이 확장 프로그램을 명시적으로 사용 설정해야 합니다.
subgroup_invocation_id
: 하위 그룹 내 스레드의 색인에 대한 내장 값입니다.subgroup_size
: 하위 그룹 크기 액세스를 위한 내장 값입니다.
다수의 하위 그룹 내장 함수 (예: subgroupAdd()
, subgroupBallot()
, subgroupBroadcast()
, subgroupShuffle()
)를 사용하면 하위 그룹 내 호출 간에 효율적인 통신과 계산이 가능합니다. 이러한 하위 그룹 작업은 단일 명령어 다중 스레드 (SIMT) 작업으로 분류됩니다. 또한 호출의 quad에서 작동하는 quad 내장 함수는 quad 내에서 데이터 통신을 지원합니다.
"shader-f16"
및 "subgroups"
기능이 모두 포함된 GPUDevice
을 요청할 때 하위 그룹과 함께 f16 값을 사용할 수 있습니다.
다음 샘플은 하위 그룹을 탐색하기에 좋은 시작점입니다. 중간 결과를 전달하기 위해 메모리를 읽거나 쓰지 않고 subgroupExclusiveMul()
내장 함수를 사용하여 계승을 계산하는 셰이더를 보여줍니다.
혼합 가능한 부동 필터링 가능 텍스처 유형 지원 삭제
이제 "float32-blendable"
기능을 통해 32비트 부동 소수점 텍스처 블렌딩을 사용할 수 있으므로 블렌딩 가능한 부동 소수점 필터링 가능 텍스처 유형에 대한 잘못된 지원이 삭제됩니다. 문제 364987733을 참고하세요.
새벽 업데이트
이제 Dawn에는 macOS 11 및 iOS 14가 필요하며 Metal 2.3 이상만 지원됩니다. 문제 381117827을 참고하세요.
이제 wgpu::Instance
의 새 GetWGSLLanguageFeatures()
메서드가 EnumerateWGSLLanguageFeatures()
를 대체합니다. 문제 368672124를 참고하세요.
다음 바인딩 유형에는 Undefined
값이 있으며 바인딩 레이아웃의 기본값이 변경되었습니다. 문제 377820810을 참고하세요.
wgpu::BufferBindingType::Undefined
는 이제Uniform
입니다.wgpu::SamplerBindingType::Undefined
는 이제Filtering
입니다.wgpu::TextureSampleType::Undefined
는 이제Float
입니다.wgpu::StorageTextureAccess::Undefined
가 이제WriteOnly
로 바뀌었습니다
여기에서는 몇 가지 주요 사항만 다룹니다. 전체 커밋 목록을 확인하세요.
WebGPU의 새로운 기능
WebGPU의 새로운 기능 시리즈에서 다룬 모든 항목의 목록입니다.
Chrome 140
- 기기 요청이 어댑터를 사용함
- 텍스처 뷰가 사용되는 경우 텍스처를 사용하는 약어
- WGSL textureSampleLevel이 1D 텍스처 지원
- bgra8unorm 읽기 전용 저장소 텍스처 사용 지원 중단
- GPUAdapter isFallbackAdapter 속성 삭제
- 새벽 업데이트
Chrome 139
Chrome 138
- 버퍼를 바인딩 리소스로 사용하는 약식
- 생성 시 매핑된 버퍼의 크기 요구사항 변경
- 최근 GPU의 아키텍처 보고서
- GPUAdapter isFallbackAdapter 속성 지원 중단
- 새벽 업데이트
Chrome 137
- externalTexture 바인딩에 텍스처 뷰 사용
- 오프셋과 크기를 지정하지 않고 버퍼 복사
- 원자에 대한 포인터를 사용하는 WGSL workgroupUniformLoad
- GPUAdapterInfo powerPreference 속성
- GPURequestAdapterOptions compatibilityMode 속성 삭제
- 새벽 업데이트
Chrome 136
Chrome 135
- null 바인드 그룹 레이아웃으로 파이프라인 레이아웃 생성 허용
- 뷰포트가 렌더링 타겟 경계를 지나 확장되도록 허용
- Android에서 실험용 호환성 모드에 더 쉽게 액세스
- maxInterStageShaderComponents 한도 삭제
- 새벽 업데이트
Chrome 134
Chrome 133
- 추가 unorm8x4-bgra 및 1컴포넌트 꼭짓점 형식
- 정의되지 않은 값으로 알 수 없는 한도를 요청하도록 허용
- WGSL 정렬 규칙 변경사항
- discard를 사용한 WGSL 성능 향상
- 외부 텍스처에 VideoFrame displaySize 사용
- copyExternalImageToTexture를 사용하여 기본이 아닌 방향의 이미지 처리
- 개발자 환경 개선
- featureLevel로 호환성 모드 사용 설정
- 실험용 하위 그룹 기능 정리
- maxInterStageShaderComponents 한도 지원 중단
- 새벽 업데이트
Chrome 132
- 텍스처 뷰 사용량
- 32비트 부동 소수점 텍스처 혼합
- GPUDevice adapterInfo 속성
- 잘못된 형식으로 캔버스 컨텍스트를 구성하면 JavaScript 오류가 발생함
- 텍스처의 샘플러 제한 필터링
- 확장된 하위 그룹 실험
- 개발자 환경 개선
- 16비트 정규화된 텍스처 형식 실험적 지원
- 새벽 업데이트
Chrome 131
- WGSL에서 거리 클리핑
- GPUCanvasContext getConfiguration()
- 점 및 선 기본 요소에는 깊이 바이어스가 없어야 합니다
- 하위 그룹의 포괄적 검색 기본 제공 함수
- multi-draw indirect 실험적 지원
- 셰이더 모듈 컴파일 옵션 strict math
- GPUAdapter requestAdapterInfo() 삭제
- 새벽 업데이트
Chrome 130
Chrome 129
Chrome 128
- 하위 그룹 실험
- 선과 점의 깊이 편향 설정 지원 중단
- preventDefault인 경우 포착되지 않은 오류 DevTools 경고 숨기기
- WGSL 보간 샘플링이 먼저 실행되고 다음 중 하나가 실행됩니다.
- 새벽 업데이트
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- Android에서 WebGPU 지원
- Windows에서 셰이더 컴파일에 FXC 대신 DXC 사용
- 컴퓨팅 및 렌더링 패스의 타임스탬프 쿼리
- 셰이더 모듈의 기본 진입점
- GPUExternalTexture 색상 공간으로 display-p3 지원
- 메모리 힙 정보
- 새벽 업데이트
Chrome 120
Chrome 119
Chrome 118
Chrome 117
- 꼭짓점 버퍼 설정 해제
- 바인드 그룹 설정 해제
- 기기가 손실된 경우 비동기 파이프라인 생성에서 오류 무시
- SPIR-V 셰이더 모듈 생성 업데이트
- 개발자 환경 개선
- 자동으로 생성된 레이아웃으로 파이프라인 캐싱
- 새벽 업데이트
Chrome 116
- WebCodecs 통합
- GPUAdapter
requestDevice()
에서 반환된 손실된 기기 importExternalTexture()
이 호출되는 경우 동영상 재생을 원활하게 유지- 사양 준수
- 개발자 환경 개선
- 새벽 업데이트