WGSL'de 16 bit kayan nokta değerleri desteği
WGSL'de f16
türü, IEEE-754 ikili16 (yarım kesinlik) biçiminin 16 bitlik kayan nokta değerleri grubudur. Geleneksel tek duyarlıklı kayan nokta (f32
) için 32 bit yerine, kayan nokta sayısını temsil etmek için 16 bit kullandığı anlamına gelir. Bu küçük boyut, özellikle büyük miktarlarda veri işlenirken önemli performans iyileştirmeleri sağlayabilir.
Karşılaştırmak gerekirse, Apple M1 Pro cihazlarda WebLLM sohbet demosunda kullanılan Llama2 7B modellerinin f16
uygulaması, f32
uygulamasına kıyasla önemli ölçüde daha hızlıdır. Aşağıdaki ekran görüntülerinde gösterildiği gibi önceden doldurma hızında% 28 ve kod çözme hızında% 41 iyileşme elde edilmiştir.
Tüm GPU'lar 16 bit kayan nokta değerlerini desteklemez. "shader-f16"
özelliği GPUAdapter
içinde kullanılabilir olduğunda, artık bu özellikle bir GPUDevice
isteğinde bulunabilir ve yarı hassasiyetli kayan nokta türünden f16
yararlanan bir WGSL gölgelendirici modülü oluşturabilirsiniz. Bu tür, yalnızca enable f16;
ile f16
WGSL uzantısını etkinleştirirseniz WGSL gölgelendirici modülünde kullanılmak üzere geçerlidir. Aksi takdirde, createShaderModule() doğrulama hatası oluşturur. Aşağıdaki minimal örneği ve issue sawn:1510'ı inceleyin.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
Aşağıdaki snippet'te gösterildiği gibi, "shader-f16"
özellik desteğine bağlı olarak WGSL gölgelendirici modülü kodunda hem f16
hem de f32
türleri alias
ile desteklenebilir.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Sınırları zorlayın
Tüm renk eklerinde, oluşturma ardışık düzeni çıkış verilerinin bir örneğini (piksel veya alt piksel) tutmak için gereken maksimum bayt sayısı varsayılan olarak 32 bayttır. Artık maxColorAttachmentBytesPerSample
sınırını kullanarak 64 kullanıcıya kadar istek gönderebilirsiniz. Aşağıdaki örneği inceleyin ve issue dawn:2036'yı inceleyin.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Aşamalar arası iletişim için kullanılan maxInterStageShaderVariables
ve maxInterStageShaderComponents
sınırları tüm platformlarda artırıldı. Ayrıntılar için sorunun geleceği:1448'e bakın.
Her gölgelendirici aşaması için bir ardışık düzen düzeninde depolama arabelleği olan maksimum bağlama grubu düzeni girişi sayısı varsayılan olarak 8'dir. Artık maxStorageBuffersPerShaderStage
sınırını kullanarak 10 kullanıcıya kadar isteyebilirsiniz. issue dawn:2159'a bakın.
Yeni bir maxBindGroupsPlusVertexBuffers
sınırı eklendi. En yüksek dizinin altındaki boş alanlar da dahil olmak üzere, aynı anda kullanılan maksimum bağlama grubu ve köşe arabellek slotu sayısından oluşur. Varsayılan değeri 24'tür. issue Dawn:1849'u inceleyin.
Derinlik şablonundaki değişiklikler
Geliştirici deneyimini iyileştirmek için derinlik şablon durumu depthWriteEnabled
ve depthCompare
özellikleri artık her zaman gerekli değildir: depthWriteEnabled
, yalnızca derinliğe sahip biçimler için gereklidir ve hiç kullanılmadığı takdirde derinlik içeren biçimler için depthCompare
gerekli değildir. issue dawn:2132'yi inceleyin.
Bağdaştırıcı bilgileri güncellemeleri
Kullanıcı chrome://flags/#enable-webgpu-developer-features
adresinde "WebGPU Geliştirici Özellikleri" işaretini etkinleştirdiğinde, requestAdapterInfo() çağrısı yapıldığında standart olmayan type
ve backend
bağdaştırıcı bilgisi özellikleri artık kullanılabilir. type
; "ayrı GPU", "entegre GPU", "CPU" veya "bilinmiyor" olabilir. backend
; "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" veya "null" olur. issue sawn:2112 ve issue sawn:2107 bölümlerine bakın.
requestAdapterInfo() işlevindeki isteğe bağlı unmaskHints
liste parametresi kaldırıldı. issue dawn:1427'yi inceleyin.
Zaman damgası sorgularının nicelenmesi
Zaman damgası sorguları, uygulamaların GPU komutlarının yürütme süresini nanosaniye hassasiyetle ölçmesini sağlar. Ancak WebGPU spesifikasyonu, zamanlama saldırısı sorunları nedeniyle zaman damgası sorgularını isteğe bağlı hale getirir. Chrome ekibi, zaman damgası sorgularının hesaplanmasının, çözünürlüğü 100 mikrosaniyeye düşürerek hassasiyet ile güvenlik arasında iyi bir uzlaşma sağladığına inanmaktadır. issue dawn:1800'e bakın.
Kullanıcılar Chrome'da chrome://flags/#enable-webgpu-developer-features
konumundaki "WebGPU Geliştirici Özellikleri" işaretini etkinleştirerek zaman damgasını ölçmeyi devre dışı bırakabilir. Yalnızca bu işaretin "timestamp-query"
özelliğini etkinleştirmediğini unutmayın. Bu özelliğin uygulanması hâlâ deneme aşamasındadır ve bu nedenle chrome://flags/#enable-unsafe-webgpu
konumunda "Güvenli Olmayan WebGPU Desteği" işaretini gerektirir.
Dawn'da "timestamp_quantization" adlı yeni bir cihaz açma/kapatma özelliği eklendi ve varsayılan olarak etkinleştirildi. Aşağıdaki snippet'te, bir cihaz istenirken zaman damgası ölçümü olmadan deneysel "zaman damgası sorgusu" özelliğine nasıl izin verileceği gösterilmektedir.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
İlkbahar temizliği özellikleri
Deneysel "timestamp-query-inside-passes" özelliğinin adı "chromium-experimental-timestamp-query-inside-passes" ise geliştiricilere bu özelliğin deneysel bir çalışma olduğunu ve şimdilik yalnızca Chromium tabanlı tarayıcılarda kullanılabileceğini göstermek amacıyla yeni bir ad verilmiştir. issue dawn:1193'e bakın.
Yalnızca kısmen uygulanan deneysel "ardışık düzen-istatistik-sorgu" özelliği artık geliştirilmediğinden kaldırıldı. chromium:1177506 sorunu bölümüne bakın.
Burada, öne çıkan özelliklerin yalnızca bir kısmı ele alınıyor. Kayıtların kapsamlı listesine göz atın.
WebGPU'daki Yenilikler
WebGPU'daki Yenilikler serisinde ele alınan her şeyin listesi.
Chrome 125
- Alt gruplar (geliştirme aşamasındaki özellik)
- 3D doku dilimi olarak oluşturma
- Dawn ile ilgili güncellemeler
Chrome 124
- Salt okuma ve okuma-yazma depolama dokuları
- Service Worker'lar ve paylaşılan çalışanlar için destek
- Yeni adaptör bilgileri özellikleri
- Hata düzeltmeleri
- Dawn ile ilgili güncellemeler
Chrome 123
- WGSL'de DP4a yerleşik işlevleri desteği
- WGSL'de kısıtlanmamış işaretçi parametreleri
- WGSL'de kompozitlerin referansını kaldırmak için söz dizimi şeker
- Şablon ve derinlik özellikleri için ayrı salt okuma durumu
- Dawn ile ilgili güncellemeler
Chrome 122
- Uyumluluk modu ile erişimi genişletme (geliştirme aşamasındaki özellik)
- maxVertexAttributes sınırını artır
- Dawn ile ilgili güncellemeler
Chrome 121
- Android'de WebGPU'yu destekleme
- Windows'da gölgelendirici derlemesi için FXC yerine DXC'yi kullanma
- İşlem ve oluşturma kartlarındaki zaman damgası sorguları
- Gölgelendirici modüllerine varsayılan giriş noktaları
- Display-p3'ü GPUExternalTexture renk alanı olarak destekleyin
- Bellek yığın bilgileri
- Dawn ile ilgili güncellemeler
Chrome 120
- WGSL'de 16 bit kayan nokta değerleri desteği
- Sınırları zorlama
- Derinlik şablonu durumunda yapılan değişiklikler
- Bağdaştırıcı bilgileriyle ilgili güncellemeler
- Zaman damgası sorgularının hesaplanması
- İlkbahar temizliği özellikleri
Chrome 119
- Filtrelenebilir 32 bit kayan dokular
- unorm10-10-10-2 köşe biçimi
- rgb10a2uint doku biçimi
- Dawn ile ilgili güncellemeler
Chrome 118
copyExternalImageToTexture()
için HTMLImageElement ve ImageData desteği- Okuma-yazma ve salt okunur depolama dokusu için deneysel destek
- Dawn ile ilgili güncellemeler
Chrome 117
- Köşe noktası arabelleği ayarını kaldır
- Bağlama grubunun ayarını kaldır
- Cihaz kaybolduğunda eşzamansız ardışık düzen oluşturma hatalarını sessize alma
- SPIR-V gölgelendirici modülü oluşturma güncellemeleri
- Geliştirici deneyimini iyileştirme
- Otomatik olarak oluşturulan düzenle ardışık düzenleri önbelleğe alma
- Dawn ile ilgili güncellemeler
Chrome 116
- WebCodecs entegrasyonu
requestDevice()
GPUAdapter tarafından döndürülen kayıp cihazimportExternalTexture()
çağrılırsa video oynatmanın sorunsuz olmasını sağlayın- Spesifikasyon uygunluğu
- Geliştirici deneyimini iyileştirme
- Dawn ile ilgili güncellemeler
Chrome 115
- Desteklenen WGSL dil uzantıları
- Direct3D 11 için deneysel destek
- AC güçle varsayılan olarak ayrı GPU'yu kullanın
- Geliştirici deneyimini iyileştirme
- Dawn ile ilgili güncellemeler
Chrome 114
- JavaScript'i optimize etme
- yapılandırılmamış tuval üzerindeki getCurrentTexture(), InvalidStateError hatası veriyor
- WGSL ile ilgili güncellemeler
- Dawn ile ilgili güncellemeler