WebGPU의 새로운 기능 (Chrome 121)

François Beaufort
François Beaufort

Android에서 WebGPU 지원

Chrome팀은 이제 Qualcomm 및 ARM GPU로 구동되는 Android 12 이상을 실행하는 기기의 Chrome 121에서 WebGPU가 기본적으로 사용 설정된다는 소식을 전해드립니다.

조만간 Android 11에서 실행되는 기기를 비롯한 다양한 Android 기기를 포괄하도록 지원이 점진적으로 확대될 예정입니다. 이러한 확장은 광범위한 하드웨어 구성에서 원활한 환경을 보장하기 위한 추가 테스트와 최적화에 의존할 것입니다. 문제 chromium:1497815를 참고하세요.

Android용 Chrome에서 실행되는 WebGPU 샘플의 스크린샷
Android용 Chrome에서 실행되는 WebGPU 샘플

Windows에서 셰이더 컴파일에 FXC 대신 DXC 사용

이제 Chrome에서 DXC (DirectX 컴파일러)의 기능을 사용하여 SM6+ 그래픽 하드웨어가 장착된 Windows D3D12 시스템에서 셰이더를 컴파일합니다. 이전에는 WebGPU가 Windows에서 셰이더 컴파일에 FXC (FX 컴파일러)를 사용했습니다. FXC는 기능적이긴 하지만 DXC에 존재하는 기능 세트와 성능 최적화에는 미치지 못했습니다.

초기 테스트에서는 DXC를 사용할 때 FXC에 비해 컴퓨팅 셰이더 컴파일 속도가 평균 20% 증가하는 것으로 나타났습니다.

컴퓨팅 및 렌더 패스의 타임스탬프 쿼리

타임스탬프 쿼리를 사용하면 WebGPU 애플리케이션이 GPU 명령어가 컴퓨팅 및 렌더 패스를 실행하는 데 걸리는 시간을 정확하게 측정할 수 있습니다 (단위: 나노초). GPU 워크로드의 성능과 동작에 대한 유용한 정보를 얻는 데 주로 사용됩니다.

GPUAdapter에서 "timestamp-query" 기능을 사용할 수 있게 되면 이제 다음 작업을 할 수 있습니다.

  • "timestamp-query" 기능으로 GPUDevice를 요청합니다.
  • "timestamp" 유형의 GPUQuerySet를 만듭니다.
  • GPUComputePassDescriptor.timestampWritesGPURenderPassDescriptor.timestampWrites을 사용하여 GPUQuerySet에서 타임스탬프 값을 쓸 위치를 정의합니다.
  • resolveQuerySet()를 사용하여 타임스탬프 값을 GPUBuffer로 확인합니다.
  • GPUBuffer의 결과를 CPU로 복사하여 타임스탬프 값을 다시 읽습니다.
  • 타임스탬프 값을 BigInt64Array으로 디코딩합니다.

다음 예를 참조하고 dawn:1800을 발행합니다.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("timestamp-query")) {
  throw new Error("Timestamp query feature is not available");
}
// Explicitly request timestamp query feature.
const device = await adapter.requestDevice({
  requiredFeatures: ["timestamp-query"],
});
const commandEncoder = device.createCommandEncoder();

// Create a GPUQuerySet which holds 2 timestamp query results: one for the
// beginning and one for the end of compute pass execution.
const querySet = device.createQuerySet({ type: "timestamp", count: 2 });
const timestampWrites = {
  querySet,
  beginningOfPassWriteIndex: 0, // Write timestamp in index 0 when pass begins.
  endOfPassWriteIndex: 1, // Write timestamp in index 1 when pass ends.
};
const passEncoder = commandEncoder.beginComputePass({ timestampWrites });
// TODO: Set pipeline, bind group, and dispatch work to be performed.
passEncoder.end();

// Resolve timestamps in nanoseconds as a 64-bit unsigned integer into a GPUBuffer.
const size = 2 * BigInt64Array.BYTES_PER_ELEMENT;
const resolveBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.QUERY_RESOLVE | GPUBufferUsage.COPY_SRC,
});
commandEncoder.resolveQuerySet(querySet, 0, 2, resolveBuffer, 0);

// Read GPUBuffer memory.
const resultBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.COPY_DST | GPUBufferUsage.MAP_READ,
});
commandEncoder.copyBufferToBuffer(resolveBuffer, 0, resultBuffer, 0, size);

// Submit commands to the GPU.
device.queue.submit([commandEncoder.finish()]);

// Log compute pass duration in nanoseconds.
await resultBuffer.mapAsync(GPUMapMode.READ);
const times = new BigInt64Array(resultBuffer.getMappedRange());
console.log(`Compute pass duration: ${Number(times[1] - times[0])}ns`);
resultBuffer.unmap();

타이밍 공격 문제로 인해 타임스탬프 쿼리는 100마이크로초의 분해능으로 양자화되므로 정밀도와 보안 사이에서 절충안이 됩니다. Chrome 브라우저에서 앱을 개발하는 동안 chrome://flags/#enable-webgpu-developer-features에서 'WebGPU 개발자 기능' 플래그를 사용 설정하여 타임스탬프 양자화를 사용 중지할 수 있습니다. 자세한 내용은 타임스탬프 쿼리 양자화를 참고하세요.

GPU가 타임스탬프 카운터를 재설정하여 타임스탬프 간 음의 델타와 같은 예기치 않은 값이 발생할 수 있으므로, 다음 Compute Boids 샘플에 타임스탬프 쿼리 지원을 추가하는 git diff changes를 확인하는 것이 좋습니다.

타임스탬프 쿼리가 포함된 Compute Boids 샘플 스크린샷
타임스탬프 쿼리가 포함된 Compute Boids 샘플입니다.

셰이더 모듈의 기본 진입점

개발자 환경을 개선하기 위해 이제 컴퓨팅 또는 렌더링 파이프라인을 만들 때 셰이더 모듈의 entryPoint를 생략할 수 있습니다. 셰이더 단계에 셰이더 단계의 고유한 진입점이 없으면 GPUValidationError가 트리거됩니다. 다음 예와 issue dawn:2254를 참고하세요.

const code = `
    @vertex fn vertexMain(@builtin(vertex_index) i : u32) ->
      @builtin(position) vec4f {
       const pos = array(vec2f(0, 1), vec2f(-1, -1), vec2f(1, -1));
       return vec4f(pos[i], 0, 1);
    }
    @fragment fn fragmentMain() -> @location(0) vec4f {
      return vec4f(1, 0, 0, 1);
    }`;
const module = myDevice.createShaderModule({ code });
const format = navigator.gpu.getPreferredCanvasFormat();
const pipeline = await myDevice.createRenderPipelineAsync({
  layout: "auto",
  vertex: { module, entryPoint: "vertexMain" },
  fragment: { module, entryPoint: "fragmentMain", targets: [{ format }] },
  vertex: { module },
  fragment: { module, targets: [{ format }] },
});

display-p3을 GPUExternalTexture 색공간으로 지원

이제 importExternalTexture()를 사용하여 HDR 동영상에서 GPUExternalTexture를 가져올 때 "display-p3" 대상 색상 공간을 설정할 수 있습니다. WebGPU가 색상 공간을 처리하는 방법을 확인하세요. 다음 예를 확인하고 chromium:1330250을 발행합니다.

// Create texture from HDR video.
const video = document.querySelector("video");
const texture = myDevice.importExternalTexture({
  source: video,
  colorSpace: "display-p3",
});

메모리 힙 정보

앱 개발 중에 많은 양을 할당할 때 메모리 제한을 예측할 수 있도록 이제 requestAdapterInfo()에서 어댑터에서 사용할 수 있는 메모리 힙의 크기 및 유형과 같은 memoryHeaps 정보를 노출합니다. 이 실험용 기능은 chrome://flags/#enable-webgpu-developer-features에서 'WebGPU 개발자 기능' 플래그가 사용 설정된 경우에만 액세스할 수 있습니다. 다음 예와 issue dawn:2249를 참고하세요.

const adapter = await navigator.gpu.requestAdapter();
const adapterInfo = await adapter.requestAdapterInfo();

for (const { size, properties } of adapterInfo.memoryHeaps) {
  console.log(size); // memory heap size in bytes
  if (properties & GPUHeapProperty.DEVICE_LOCAL)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_VISIBLE)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_COHERENT) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_UNCACHED) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_CACHED)   { /* ... */ }
}
어댑터 정보에서 메모리 힙을 보여주는 https://webgpureport.org의 스크린샷
https://webgpureport.org에 표시된 어댑터 정보 메모리 힙

여명 업데이트

WGSL 언어 기능을 처리하도록 wgpu::InstanceHasWGSLLanguageFeatureEnumerateWGSLLanguageFeatures 메서드가 추가되었습니다. dawn:2260 문제를 참고하세요.

비표준 wgpu::Feature::BufferMapExtendedUsages 기능을 사용하면 wgpu::BufferUsage::MapRead 또는 wgpu::BufferUsage::MapWrite 및 기타 wgpu::BufferUsage를 사용하여 GPU 버퍼를 만들 수 있습니다. 다음 예를 참조하고 dawn:2204를 발행합니다.

wgpu::BufferDescriptor descriptor = {
  .size = 128,
  .usage = wgpu::BufferUsage::MapWrite | wgpu::BufferUsage::Uniform
};
wgpu::Buffer uniformBuffer = device.CreateBuffer(&descriptor);

uniformBuffer.MapAsync(wgpu::MapMode::Write, 0, 128,
   [](WGPUBufferMapAsyncStatus status, void* userdata)
   {
      wgpu::Buffer* buffer = static_cast<wgpu::Buffer*>(userdata);
      memcpy(buffer->GetMappedRange(), data, sizeof(data));
   },
   &uniformBuffer);

ANGLE 텍스처 공유, D3D11 멀티스레드 보호, 암시적 기기 동기화, Norm16 텍스처 형식, 타임스탬프 쿼리 내부 패스, Pixel 로컬 저장소, 셰이더 기능, 다중 평면 형식과 같은 기능이 문서화되었습니다.

Chrome팀에서 Dawn용 공식 GitHub 저장소를 만들었습니다.

여기에서는 주요 특징 중 일부만 다루었습니다. 전체 커밋 목록을 확인하세요.

WebGPU의 새로운 기능

WebGPU의 새로운 기능 시리즈에서 다룬 모든 사항의 목록

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113