WebGPU의 새로운 기능 (Chrome 125)

François Beaufort
François Beaufort

이번에는 WebGPU 기능이 다소 부족하게 느껴질 수 있지만, 곧 주요 발전이 있을 예정입니다. 향후 출시에는 셰이더 컴파일 속도 개선, WGPUFuture를 사용하는 구현의 비동기 모델 변경과 같은 기능이 포함될 예정입니다.

하위 그룹 (개발 중인 기능)

하위 그룹 기능을 사용하면 SIMD 수준 병렬 처리가 가능해 그룹 내 스레드가 통신하고 집단 수학 연산 (예: 16개 숫자의 합계 계산)을 실행할 수 있습니다. 이를 통해 매우 효율적인 교차 스레드 데이터 공유가 가능합니다.

하위 그룹 작업은 최신 GPU API에서 지원되지만 이름과 구현 세부정보는 다릅니다. Chrome팀은 공통점을 파악했으며 현재 이 기능을 표준화하기 위해 노력하고 있습니다. 궁금한 점이 있으면 제안서댓글을 확인하세요.

개발자가 사용해 보고 의견을 공유할 수 있도록 chrome://flags/#enable-experimental-web-platform-features의 '실험적 웹 플랫폼 기능' 플래그 뒤에 최소한의 비표준 하위 그룹 구현이 있습니다. 아직 WebGPU 컨텍스트에서 실제 이점이 입증되지 않았기 때문입니다.

"chromium-experimental-subgroups" 기능을 GPUAdapter에서 사용할 수 있는 경우 이 기능이 있는 GPUDevice를 요청하여 WGSL에서 실험적 하위 그룹을 지원하고 minSubgroupSizemaxSubgroupSize 한도를 확인합니다.

또한 WGSL 코드에서 enable chromium_experimental_subgroups를 사용하여 이 확장 프로그램을 명시적으로 사용 설정해야 합니다. 사용 설정하면 다음 항목에 액세스할 수 있습니다.

  • subgroup_invocation_id: 하위 그룹 내 스레드의 색인에 대한 내장 값입니다.
  • subgroup_size: 하위 그룹 크기 액세스를 위한 내장 값입니다.
  • subgroupBallot(value): 활성 호출에서 value이 true이면 subgroup_invocation_id에 해당하는 비트가 1이고 그렇지 않으면 0인 비트 필드 집합을 반환합니다.
  • subgroupBroadcast(value, id): id와 일치하는 subgroup_invocation_id를 사용하여 호출에서 value를 하위 그룹 내의 모든 호출에 브로드캐스트합니다. 참고: id는 컴파일-시간 상수여야 합니다.

다음 코드 스니펫은 하위 그룹의 잠재력을 실험하고 발견할 수 있는 기반을 제공합니다.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("chromium-experimental-subgroups")) {
  throw new Error("Experimental subgroups support is not available");
}
// Explicitly request experimental subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["chromium-experimental-subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable chromium_experimental_subgroups;

  @compute @workgroup_size(64) fn main(
      @builtin(global_invocation_id) global_id : vec3u,
      @builtin(subgroup_size) sg_size : u32,
      @builtin(subgroup_invocation_id) sg_id : u32) {
    // TODO: Use subgroupBallot() and subgroupBroadcast().
  }`,
});

3D 텍스처 슬라이스로 렌더링

이제 GPURenderPassColorAttachment의 새로운 depthSlice 멤버를 사용하여 렌더링 패스 내에서 3D 텍스처 슬라이스로 직접 렌더링할 수 있으므로 일반적인 2D 텍스처 렌더링을 넘어 기능을 확장할 수 있습니다. 이 추가 기능을 사용하면 3D 텍스처 볼륨으로 직접 렌더링하여 복셀 기반 장면과 효과를 만들 수 있습니다. dawn:1020 문제를 참고하세요.

새벽 업데이트

전체 커밋 목록을 확인하세요.

WebGPU의 새로운 기능

WebGPU의 새로운 기능 시리즈에서 다룬 모든 항목의 목록입니다.

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113