WGSL의 DP4a 기본 제공 함수 지원
DP4a (4개 요소의 내적 및 누적)는 정규화에 관한 딥 러닝 추론에 일반적으로 사용되는 GPU 명령어 집합을 나타냅니다. 8비트 정수 내적을 효율적으로 실행하여 이러한 int8 양자화 모델의 계산을 가속화합니다. 메모리와 네트워크 대역폭을 최대 75%까지 절약하고 f32 버전과 비교해 추론에서 머신러닝 모델의 성능을 개선할 수 있습니다. 그 결과 현재 많은 인기 AI 프레임워크에서 널리 사용되고 있습니다.
"packed_4x8_integer_dot_product"
WGSL 언어 확장 프로그램이 navigator.gpu.wgslLanguageFeatures
에 있는 경우 이제 8비트 정수의 4개 구성요소 벡터를 패킹하는 32비트 정수 스칼라를 dot4U8Packed
및 dot4I8Packed
내장 함수를 사용하여 WGSL 셰이더 코드의 내적 명령어에 대한 입력으로 사용할 수 있습니다. pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
, unpack4xU8
WGSL 내장 함수를 사용하여 8비트 정수의 4개 구성요소 벡터로 압축된 팩킹 및 unpacking 명령을 사용할 수도 있습니다.
WGSL 셰이더 코드 상단에서 requires packed_4x8_integer_dot_product;
의 비이식 가능성을 알리려면 requires-directive를 사용하는 것이 좋습니다. 다음 예시와 issue tint:1497을 참고하세요.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
이 사양과 구현을 완료하기 위해 노력해 주신 상하이의 Intel 웹 그래픽팀에 특별히 감사드립니다.
WGSL의 제한되지 않은 포인터 매개변수
"unrestricted_pointer_parameters"
WGSL 언어 확장 프로그램은 WGSL 함수에 전달할 수 있는 포인터에 대한 제한을 완화합니다.
사용자가 선언한 함수에 대한
storage
,uniform
,workgroup
주소 공간의 매개변수 포인터입니다.구조체 멤버 및 배열 요소 포인터를 사용자 선언 함수에 전달합니다.
자세한 내용은 함수 매개변수로서 포인터 | WGSL 둘러보기를 참고하세요.
이 기능은 navigator.gpu.wgslLanguageFeatures
를 사용하여 기능 감지할 수 있습니다. WGSL 셰이더 코드 상단에 requires unrestricted_pointer_parameters;
의 비이식성 가능성을 알리기 위해 항상 requires-directive를 사용하는 것이 좋습니다. 다음 예, WGSL 사양 변경사항, issue tint:2053을 참고하세요.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
WGSL에서 복합을 역참조하기 위한 구문 슈가
"pointer_composite_access"
WGSL 언어 확장 프로그램이 navigator.gpu.wgslLanguageFeatures
에 있는 경우 이제 WGSL 셰이더 코드는 데이터를 직접 사용하는지 또는 데이터 포인터를 사용하는지에 관계없이 동일한 점 (.
) 문법을 사용하여 복잡한 데이터 유형의 구성요소에 대한 액세스를 지원합니다. 방법은 다음과 같습니다.
foo
가 포인터인 경우:foo.bar
는(*foo).bar
를 작성하는 더 편리한 방법입니다. 별표 (*
)는 일반적으로 포인터를 역참조할 수 있는 '참조'로 변환하는 데 필요하지만 이제 포인터와 참조가 훨씬 더 유사해져 거의 상호 교환이 가능합니다.foo
가 포인터가 아닌 경우: 점 (.
) 연산자는 멤버에 직접 액세스할 때와 똑같이 작동합니다.
마찬가지로 pa
가 배열의 시작 주소를 저장하는 포인터인 경우 pa[i]
를 사용하면 해당 배열의 'i
번째 요소가 저장된 메모리 위치에 직접 액세스할 수 있습니다.
WGSL 셰이더 코드 상단에서 requires pointer_composite_access;
의 비이식 가능성을 알리려면 requires-directive를 사용하는 것이 좋습니다. 다음 예와 issue tint:2113을 참고하세요.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
스텐실 및 깊이 측면의 별도 읽기 전용 상태
이전에는 렌더링 패스의 읽기 전용 깊이 스텐실 어테치먼트의 두 측면 (깊이 및 스텐실)이 모두 읽기 전용으로 설정되어야 했습니다. 이 제한은 해제되었습니다. 이제 스텐실 버퍼가 추가 처리를 위한 픽셀을 식별하도록 작성되는 동안 깊이 측정값을 읽기 전용 방식으로 사용할 수 있습니다(예: 접촉 그림자 추적). 문제 dawn:2146을 참고하세요.
Dawn 업데이트
이제 wgpuDeviceSetUncapturedErrorCallback()
로 설정된 포착되지 않은 오류 콜백이 오류가 발생하면 즉시 호출됩니다. 이는 개발자가 디버깅을 위해 일관되게 기대하고 원하는 바입니다. change dawn:173620을 참고하세요.
webgpu.h API의 wgpuSurfaceGetPreferredFormat()
메서드가 구현되었습니다. issue dawn:1362를 참고하세요.
여기에는 주요 내용 중 일부만 다룹니다. 전체 커밋 목록을 확인하세요.
WebGPU의 새로운 기능
WebGPU의 새로운 기능 시리즈에서 다룬 모든 항목의 목록입니다.
Chrome 131
- WGSL에서 거리 클립하기
- GPUCanvasContext getConfiguration()
- 점 및 선 원시에는 깊이 바이어스가 없어야 함
- 하위 그룹을 위한 포용 스캔 기본 제공 함수
- 다중 그리기 간접 실험적 지원
- 셰이더 모듈 컴파일 옵션의 엄격한 수학
- GPUAdapter requestAdapterInfo() 삭제
- Dawn 업데이트
Chrome 130
Chrome 129
Chrome 128
- 하위 그룹 실험
- 선 및 점의 설정 깊이 바이어스 지원 중단
- preventDefault인 경우 캡처되지 않은 오류 DevTools 경고 숨기기
- WGSL에서는 샘플링을 먼저 보간하고
- Dawn 업데이트
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
- WGSL의 DP4a 내장 함수 지원
- WGSL의 제한되지 않은 포인터 매개변수
- WGSL에서 합성물 역참조를 위한 문법 슈가
- 스텐실 및 깊이 측면에 관한 별도의 읽기 전용 상태
- Dawn 업데이트
Chrome 122
Chrome 121
- Android에서 WebGPU 지원
- Windows에서 셰이더 컴파일에 FXC 대신 DXC 사용
- 컴퓨팅 및 렌더링 패스의 타임스탬프 쿼리
- 셰이더 모듈의 기본 진입점
- display-p3을 GPUExternalTexture 색상 공간으로 지원
- 메모리 힙 정보
- Dawn 업데이트
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
에서 HTMLImageElement 및 ImageData 지원- 읽기 쓰기 저장소 텍스처 및 읽기 전용 저장소 텍스처에 대한 실험적 지원
- Dawn 업데이트
Chrome 117
- 꼭짓점 버퍼 설정 해제
- 바인드 그룹 설정 해제
- 기기 분실 시 비동기 파이프라인 생성 시 오류 차단
- SPIR-V 셰이더 모듈 만들기 업데이트
- 개발자 환경 개선
- 자동으로 생성된 레이아웃으로 파이프라인 캐싱
- Dawn 업데이트
Chrome 116
- WebCodecs 통합
- GPUAdapter
requestDevice()
에서 반환된 분실 기기 importExternalTexture()
가 호출될 때 동영상 재생을 원활하게 유지- 사양 적합성
- 개발자 환경 개선
- Dawn 업데이트