WebGPU'daki (Chrome 120) Yenilikler

François Beaufort
François Beaufort

WGSL'de 16 bit kayan nokta değerleri desteği

WGSL'de f16 türü, IEEE-754 ikili 16 (yarım hassasiyet) biçimindeki 16 bitlik kayan nokta değerleri grubudur. Geleneksel tek duyarlıklı kayan nokta (f32) için 32 bit yerine, kayan nokta sayısını temsil etmek için 16 bit kullandığı anlamına gelir. Bu küçük boyut, özellikle büyük miktarda veri işlenirken önemli performans iyileştirmeleri sağlayabilir.

Karşılaştırma yapmak gerekirse, Apple M1 Pro cihazlarda WebLLM sohbet demosunda kullanılan Llama2 7B modellerinin f16 uygulanması f32 uygulamasından önemli ölçüde daha hızlıdır. Aşağıdaki ekran görüntülerinde görüldüğü gibi, önceden doldurma hızında% 28 iyileşme ve kod çözme hızında% 41 iyileşme görülmüştür.

f32 ve f16 Llama2 7B modellerini içeren WebLLM sohbet demolarının ekran görüntüsü.
f32 (solda) ve f16 (sağ) Llama2 7B modellerini içeren WebLLM sohbet demoları.

Bazı GPU'lar, 16 bit kayan nokta değerlerini desteklemez. "shader-f16" özelliği GPUAdapter içinde kullanılabildiğinde artık bu özellikle bir GPUDevice isteyebilir ve yarı hassasiyetli kayan nokta türünden (f16) yararlanan bir WGSL gölgelendirici modülü oluşturabilirsiniz. Bu tür yalnızca enable f16; ile f16 WGSL uzantısını etkinleştirirseniz WGSL gölgelendirici modülünde kullanılabilir. Aksi takdirde, createShaderModule() bir doğrulama hatası oluşturur. Aşağıdaki minimum örneği ve sorun şafak:1510 bilgisini inceleyin.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
  throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
  requiredFeatures: ["shader-f16"],
});

const code = `
  enable f16;

  @compute @workgroup_size(1)
  fn main() {
    const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
  }
`;

const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...

Aşağıdaki snippet'te gösterildiği gibi "shader-f16" özellik desteğine bağlı olarak, WGSL gölgelendirici modülü kodunda hem f16 hem de f32 türlerini alias ile desteklemek mümkündür.

const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");

const device = await adapter.requestDevice({
  requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});

const header = hasShaderF16
  ? `enable f16;
     alias min16float = f16;`
  : `alias min16float = f32;`;

const code = `
  ${header}

  @compute @workgroup_size(1)
  fn main() {
    const c = vec3<min16float>(1.0, 2.0, 3.0);
  }
`;

Sınırları zorlayın

Tüm renk eklerinde, oluşturma ardışık düzeni çıkış verilerinin bir örneğini (piksel veya alt piksel) tutmak için gereken maksimum bayt sayısı varsayılan olarak 32 bayttır. Artık maxColorAttachmentBytesPerSample sınırı kullanılarak 64'e kadar istek gönderilebilir. Aşağıdaki örneğe ve sorun şafak:2036'ya bakın.

const adapter = await navigator.gpu.requestAdapter();

if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
  // When the desired limit isn't supported, take action to either fall back to
  // a code path that does not require the higher limit or notify the user that
  // their device does not meet minimum requirements.
}

// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
  requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});

Aşamalılar arası iletişim için kullanılan maxInterStageShaderVariables ve maxInterStageShaderComponents sınırları tüm platformlarda artırıldı. Ayrıntılar için issues dawn:1448 sayfasına bakın.

Her gölgelendirici aşamasında depolama arabellekleri olan bir ardışık düzen düzenindeki maksimum bağlama grubu düzeni girişlerinin sayısı varsayılan olarak 8'dir. Artık maxStorageBuffersPerShaderStage sınırı kullanılarak 10 taneye kadar istek gönderilebilir. Sorun şafak:2159 bölümünü inceleyin.

Yeni maxBindGroupsPlusVertexBuffers sınırı eklendi. En yüksek dizinin altındaki boş alanlar da sayılarak, aynı anda kullanılan maksimum bağlama grubu ve köşe arabellek alanı sayısından oluşur. Varsayılan değeri 24'tür. Sorun şafak:1849 bölümünü inceleyin.

Derinlik şablonu durumunda yapılan değişiklikler

Geliştirici deneyimini iyileştirmek için derinlik şablon durumu depthWriteEnabled ve depthCompare özellikleri artık her zaman gerekli değildir: depthWriteEnabled yalnızca derinliği olan biçimler için gereklidir. Hiç kullanılmayan biçimler için depthCompare gerekli değildir. Sorun şafak:2132 bölümünü inceleyin.

Bağdaştırıcı bilgisi güncellemeleri

Standart olmayan type ve backend bağdaştırıcı bilgisi özellikleri, artık kullanıcı "WebGPU Geliştirici Özellikleri"ni etkinleştirdiğinde requestAdapterInfo() çağrısı yapıldığında kullanılabilir flag chrome://flags/#enable-webgpu-developer-features adresine gönderin. type; "ayrı GPU", "entegre GPU", "CPU" veya "bilinmiyor" olabilir. backend; "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" veya "null"dur. Issue dawn:2112 ve issues dawn:2107 bilgilerine bakın.

Arka uç ve bağdaştırıcı bilgilerini yazma özelliği bulunan https://webgpureport.org ekran görüntüsü.
Bağdaştırıcı bilgilerinin arka ucu ve türü https://webgpureport.org adresinde gösteriliyor.

requestAdapterInfo() işlevindeki isteğe bağlı unmaskHints liste parametresi kaldırıldı. Sorun şafak:1427 bölümünü inceleyin.

Zaman damgası sorgularının nicelenmesi

Zaman damgası sorguları, uygulamaların GPU komutlarının yürütme süresini nanosaniye hassasiyetiyle ölçmesine olanak tanır. Ancak WebGPU spesifikasyonu, zamanlama saldırısı endişeleri nedeniyle zaman damgası sorgularını isteğe bağlı hale getirir. Chrome ekibi, zaman damgası sorgularını ölçmenin, çözünürlüğü 100 mikrosaniyeye düşürerek hassasiyet ve güvenlik arasında iyi bir uzlaşma sağladığına inanıyor. Issue dawn:1800'ü görün.

Kullanıcılar Chrome'da "WebGPU Geliştirici Özellikleri"ni etkinleştirerek zaman damgası miktarını devre dışı bırakabilirler flag, chrome://flags/#enable-webgpu-developer-features adresine ekleyebilirsiniz. Bu işaretin tek başına "timestamp-query" özelliğini etkinleştirmediğini unutmayın. Uygulanması hâlâ deneysel olduğundan "Güvenli Olmayan WebGPU Desteği" gerekli chrome://flags/#enable-unsafe-webgpu adresinde işaretle.

Şafak vaktinde "timestamp_quantization" adlı yeni bir cihaz açma/kapatma düğmesi eklendi ve varsayılan olarak etkin. Aşağıdaki snippet'te, deneysel "timestamp-query"ye nasıl izin vereceğiniz gösterilmektedir özelliği ile birlikte çalışır.

wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};

const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;

const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = &timestampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;

wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};

// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);

Bahar temizliği özellikleri

Deneysel "timestamp-query-inside-passes" özellik "chromium-experimental-timestamp-query-inside-passes" olarak yeniden adlandırıldı ve geliştiricilere bu özelliğin deneysel olduğunu ve şimdilik yalnızca Chromium tabanlı tarayıcılarda kullanılabildiğini açıklayın. Sorun şafak:1193 bölümünü inceleyin.

Deneysel "banner-statistics-query" ancak kısmen uygulanan özellik, artık geliştirilmediği için kaldırılmıştır. Chromium:1177506 sorunu konusuna bakın.

Bunlar, öne çıkan özelliklerden yalnızca bazılarıdır. Taahhütlerin kapsamlı listesini inceleyin.

WebGPU'daki Yenilikler

WebGPU'daki Yenilikler serisinde ele alınan her şeyin listesi.

Chrome 127 sürümü

Chrome 126

Chrome 125 sürümü

Chrome 124 sürümü

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119 sürümü

Chrome 118 sürümü

Chrome 117 sürümü

Chrome 116

Chrome 115 sürümü

Chrome 114 sürümü

Chrome 113