دعم قيم النقطة العائمة 16 بت في WGSL
في WGSL، يكون النوع f16
هو مجموعة من قيم النقطة العائمة بتنسيق 16 بت لتنسيق IEEE-754 dual16 (نصف الدقة). ويعني ذلك أنّه يستخدم 16 بت لتمثيل رقم نقطة عائمة، بدلاً من 32 بت للنقطة العائمة التقليدية ذات الدقة الأحادية (f32
). ويمكن أن يؤدي هذا الحجم الصغير إلى تحسينات كبيرة في الأداء، لا سيما عند معالجة كميات كبيرة من البيانات.
وللمقارنة، على جهاز Apple M1 Pro، يكون تنفيذ f16
لطُرز Llama2 7B المستخدَمة في العرض التوضيحي لمحادثة WebLLM أسرع بكثير من تنفيذ f32
، مع تحسّن بنسبة% 28 في سرعة الملء المسبق و41% في سرعة فك الترميز كما هو موضّح في لقطات الشاشة التالية.
لا تتوافق بعض وحدات معالجة الرسومات مع قيم النقطة العائمة 16 بت. عند توفّر ميزة "shader-f16"
في GPUAdapter
، يمكنك الآن طلب GPUDevice
بهذه الميزة وإنشاء وحدة أداة تظليل WGSL تستفيد من نوع النقطة العائمة نصف الدقة f16
. هذا النوع صالح للاستخدام في وحدة أداة تظليل WGSL فقط في حال تفعيل إضافة WGSL f16
من خلال enable f16;
. وبخلاف ذلك، ستؤدي createShaderModule() إلى حدوث خطأ في عملية التحقّق. راجِع المثال المصغر التالي ورقم سمة dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
من الممكن إتاحة كل من النوعين f16
وf32
في رمز وحدة أداة تظليل WGSL باستخدام alias
حسب دعم ميزة "shader-f16"
كما هو موضّح في المقتطف التالي.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
أطلِق العنان لقدراتك
وفقًا للإعدادات التلقائية، يبلغ الحد الأقصى لعدد وحدات البايت اللازمة للاحتفاظ بعيّنة واحدة (بكسل أو وحدة بكسل فرعية) من بيانات نتائج مسار العرض، في جميع مرفقات الألوان، 32 بايت. ويمكن الآن طلب ما يصل إلى 64 وحدة إعلانية باستخدام الحدّ الأقصى البالغ maxColorAttachmentBytesPerSample
. يُرجى الاطّلاع على المثال التالي وإصدار سمة dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
تمت زيادة الحدود المسموح بها maxInterStageShaderVariables
وmaxInterStageShaderComponents
المستخدَمة للتواصل بين المراحل المختلفة على جميع المنصات. يُرجى مراجعة رقم فجر:1448 للحصول على التفاصيل.
وبالنسبة إلى كل مرحلة من مراحل التظليل، يكون الحد الأقصى لعدد إدخالات تنسيق المجموعة في مخطط المسار والذي يمثل مخازن مؤقتة 8 افتراضيًا. ويمكن الآن طلب ما يصل إلى 10 طلبات باستخدام الحدّ الأقصى البالغ maxStorageBuffersPerShaderStage
. راجِع عدد الفجر:2159.
تمت إضافة حد جديد بقيمة maxBindGroupsPlusVertexBuffers
. ويتكون من الحد الأقصى لعدد خانات مجموعة الربط وخانات التخزين المؤقت الرأسية المستخدمة في وقت واحد، مع حساب أي خانات فارغة أسفل أعلى مؤشر. وقيمتها الافتراضية هي 24. راجِع عدد الفجر:1849.
التغييرات في حالة عمق الاستنسل
لتحسين تجربة المطوِّر، لم تعُد سمتا حالة الاستنسل العميق depthWriteEnabled
وdepthCompare
مطلوبتين دائمًا: depthWriteEnabled
مطلوب فقط للتنسيقات التي لها عمق، ولا يكون depthCompare
مطلوبًا للتنسيقات ذات العمق إذا لم يتم استخدامها على الإطلاق. راجِع عدد الفجر:2132.
إشعارات معلومات المحوّل
أصبحت سمات معلومات محوّلَي "type
" و"backend
" غير العادية متاحة الآن عند طلب requestAdapterInfo() عندما يفعّل المستخدم "ميزات مطوِّر برامج WebGPU". الإبلاغ على chrome://flags/#enable-webgpu-developer-features
يمكن أن تكون السمة type
"وحدة معالجة رسومات منفصلة" أو "وحدة معالجة رسومات مدمَجة" أو "وحدة معالجة مركزية" أو "غير معروفة". السمة backend
هي إما "WebGPU" أو "D3D11" أو "D3D12" أو "metal" أو "vulkan" أو "openGL" أو "openGLES" أو "خالية". راجِع عدد الفجر:2112 وعدد الفجر:2107.
تمت إزالة مَعلمة القائمة unmaskHints
الاختيارية في requestAdapterInfo(). راجِع عدد الفجر:1427.
قياس كمية طلبات البحث عن الطوابع الزمنية
تتيح طلبات البحث عن الطوابع الزمنية للتطبيقات قياس وقت تنفيذ أوامر وحدة معالجة الرسومات بدقة نانو ثانية. ومع ذلك، تجعل مواصفات WebGPU طلبات البحث عن الطوابع الزمنية اختيارية بسبب مشاكل هجوم الوقت. يعتقد فريق Chrome أنّ تحديد كمية طلبات البحث عن الطوابع الزمنية يوفّر حلاً وسطًا مناسبًا بين الدقة والأمان، وذلك من خلال تقليل درجة الدقة إلى 100 ميكرو ثانية. راجِع عدد الفجر:1800.
في Chrome، يمكن للمستخدمين إيقاف قياس الطوابع الزمنية من خلال تفعيل "ميزات مطوّري برامج WebGPU". flag في chrome://flags/#enable-webgpu-developer-features
. تجدر الإشارة إلى أنّ هذه العلامة وحدها لا تفعّل ميزة "timestamp-query"
. لا يزال تنفيذه في المرحلة التجريبية، وبالتالي يتطلّب استخدام "دعم غير آمن لواجهة برمجة التطبيقات". الإبلاغ عن مشكلة في chrome://flags/#enable-unsafe-webgpu
.
في الفجر، تبديل بيانات جهاز جديد باسم "timestamp_quantization" قد تمت إضافتها ويتم تفعيلها تلقائيًا. يوضّح لك المقتطف التالي كيفية السماح بـ "timestamp-query" التجريبي بدون تحديد الكمية للطابع الزمني عند طلب جهاز.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
ميزات تنظيف الربيع
الطابع التجريبي "timestamp-query-inside-passes" تمت إعادة تسمية الميزة إلى "chromium-experimental-timestamp-query-inside-passes". لتوضيح للمطورين أن هذه الميزة تجريبية ولا تتوفر حاليًا إلا في المتصفحات المستندة إلى Chromium. راجِع عدد الفجر:1193.
يتيح " الاطلاع على إحصاءات البحث" التي تم تنفيذها جزئيًا فقط، تمت إزالتها لأنها لم تعد قيد التطوير. يُرجى الاطّلاع على issue chromium:1177506.
يتناول هذا فقط بعض النقاط الرئيسية. يمكنك الاطّلاع على قائمة الالتزامات الشاملة.
الميزات الجديدة في WebGPU
قائمة بكل ما تم تناوله في سلسلة الميزات الجديدة في WebGPU.
الإصدار 128 من Chrome
- تجربة المجموعات الفرعية
- إيقاف ضبط انحياز عمق الخطوط والنقاط
- إخفاء تحذير "أدوات مطوري البرامج" للخطأ الذي لم يتم تسجيله في حال منع التثبيت التلقائي
- دمج WGSL أخذ العينات أولاً وإمّا
- إشعارات الفجر
الإصدار 127 من Chrome
- التوافق التجريبي مع OpenGL ES على أجهزة Android
- سمة معلومات محوّل وحدة معالجة الرسومات
- تحسينات إمكانية التشغيل التفاعلي WebAssembly
- الأخطاء المحسّنة في برنامج ترميز الأوامر
- إشعارات الفجر
الإصدار 126 من Chrome
- زيادة حد maxTextureArrayLayers
- تحسين تحميل المخزن المؤقت لخلفية Vulkan
- تحسينات وقت تجميع Shader
- يجب أن تكون المخزن المؤقت للأوامر المرسَلة فريدة
- إشعارات الفجر
الإصدار 125 من Chrome
الإصدار 124 من Chrome
- زخارف مساحة التخزين للقراءة فقط والقراءة والكتابة
- دعم مشغّلي الخدمات والعاملين المشترَكين
- السمات الجديدة لمعلومات المحوّلات
- إصلاح الأخطاء
- إشعارات الفجر
الإصدار 123 من Chrome
- توفُّر دوال DP4a المضمَّنة في WGSL
- معلَمات المؤشر غير المحدودة في WGSL
- سكر البنية لتمييز المركّبات في WGSL
- حالة القراءة فقط لجوانب الاستنسل والعمق
- إشعارات الفجر
الإصدار 122 من Chrome
- توسيع مدى الوصول باستخدام وضع التوافق (الميزة قيد التطوير)
- زيادة حد maxVertexAttributes
- إشعارات الفجر
الإصدار 121 من Chrome
- إتاحة استخدام WebGPU على Android
- استخدام DXC بدلاً من FXC لتجميع أدوات التظليل على Windows
- طلبات البحث عن الطابع الزمني في بطاقات الحوسبة والعرض
- نقاط الدخول التلقائية لوحدات أدوات التظليل
- إتاحة العرض-p3 كمساحة لونية في GPUExternalTexture
- معلومات حول الذاكرة المجمّعة
- إشعارات الفجر
الإصدار 120 من Chrome
- إتاحة قيم النقطة العائمة 16 بت في WGSL
- تجاوز الحدود
- التغييرات على حالة الاستنسل العميق
- تعديلات على معلومات المحوّل
- تحديد كمية طلبات الطابع الزمني
- ميزات تنظيف الربيع
الإصدار 119 من Chrome
- زخارف عائمة 32 بت قابلة للفلترة
- تنسيق رأس العمود unorm10-10-10-2
- تنسيق مادة عرض rgb10a2uint
- إشعارات الفجر
الإصدار 118 من Chrome
- إتاحة HTMLImageElement وImageData في
copyExternalImageToTexture()
- إتاحة تجريبية لزخرفة مساحة التخزين للقراءة والقراءة فقط
- إشعارات الفجر
الإصدار 117 من Chrome
- إلغاء ضبط المخزن المؤقت للرأس
- إلغاء ضبط مجموعة الربط
- كتم الأخطاء الناتجة عن إنشاء مسار غير متزامن عند فقدان الجهاز
- تعديلات على إنشاء وحدة تظليل SPIR-V
- تحسين تجربة المطوِّرين
- مسارات التخزين المؤقت باستخدام التنسيق الذي يتم إنشاؤه تلقائيًا
- إشعارات الفجر
الإصدار 116 من Chrome
- دمج WebCodecs
- الجهاز المفقود الذي تم إرجاعه من خلال محوّل وحدة معالجة الرسومات
requestDevice()
- الحفاظ على سلاسة تشغيل الفيديو في حال اختيار
importExternalTexture()
- توافق المواصفات
- تحسين تجربة المطوِّرين
- إشعارات الفجر
الإصدار 115 من Chrome
- إضافات لغات WGSL المتوافقة
- الدعم التجريبي لـ Direct3D 11
- الحصول على وحدة معالجة رسومات منفصلة تلقائيًا باستخدام طاقة التيار المتردد
- تحسين تجربة المطوِّرين
- إشعارات الفجر
الإصدار 114 من Chrome
- تحسين JavaScript
- getCurrentTexture() على لوحة الرسم التي لم يتم ضبطها تؤدي إلىValidStateError
- إشعارات من WGSL
- إشعارات الفجر