الميزات الجديدة في WebGPU (الإصدار 120 من Chrome)

François Beaufort
François Beaufort

دعم قيم النقطة العائمة 16 بت في WGSL

في WGSL، يكون النوع f16 هو مجموعة من قيم النقطة العائمة بتنسيق 16 بت لتنسيق IEEE-754 dual16 (نصف الدقة). ويعني ذلك أنّه يستخدم 16 بت لتمثيل رقم نقطة عائمة، بدلاً من 32 بت للنقطة العائمة التقليدية ذات الدقة الأحادية (f32). ويمكن أن يؤدي هذا الحجم الصغير إلى تحسينات كبيرة في الأداء، لا سيما عند معالجة كميات كبيرة من البيانات.

وللمقارنة، على جهاز Apple M1 Pro، يكون تنفيذ f16 لطُرز Llama2 7B المستخدَمة في العرض التوضيحي لمحادثة WebLLM أسرع بكثير من تنفيذ f32، مع تحسّن بنسبة% 28 في سرعة الملء المسبق و41% في سرعة فك الترميز كما هو موضّح في لقطات الشاشة التالية.

لقطة شاشة للعروض التوضيحية لمحادثات WebLLM مع طرازَي f32 وf16 Llama2 7B
عروض دردشة WebLLM مع طرز f32 (على اليسار) وf16 (اليمين) Llama2 7B

لا تتوافق بعض وحدات معالجة الرسومات مع قيم النقطة العائمة 16 بت. عند توفّر ميزة "shader-f16" في GPUAdapter، يمكنك الآن طلب GPUDevice بهذه الميزة وإنشاء وحدة أداة تظليل WGSL تستفيد من نوع النقطة العائمة نصف الدقة f16. هذا النوع صالح للاستخدام في وحدة أداة تظليل WGSL فقط في حال تفعيل إضافة WGSL f16 من خلال enable f16;. وبخلاف ذلك، ستؤدي createShaderModule() إلى حدوث خطأ في عملية التحقّق. راجِع المثال المصغر التالي ورقم سمة dawn:1510.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
  throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
  requiredFeatures: ["shader-f16"],
});

const code = `
  enable f16;

  @compute @workgroup_size(1)
  fn main() {
    const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
  }
`;

const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...

من الممكن إتاحة كل من النوعين f16 وf32 في رمز وحدة أداة تظليل WGSL باستخدام alias حسب دعم ميزة "shader-f16" كما هو موضّح في المقتطف التالي.

const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");

const device = await adapter.requestDevice({
  requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});

const header = hasShaderF16
  ? `enable f16;
     alias min16float = f16;`
  : `alias min16float = f32;`;

const code = `
  ${header}

  @compute @workgroup_size(1)
  fn main() {
    const c = vec3<min16float>(1.0, 2.0, 3.0);
  }
`;

أطلِق العنان لقدراتك

وفقًا للإعدادات التلقائية، يبلغ الحد الأقصى لعدد وحدات البايت اللازمة للاحتفاظ بعيّنة واحدة (بكسل أو وحدة بكسل فرعية) من بيانات نتائج مسار العرض، في جميع مرفقات الألوان، 32 بايت. ويمكن الآن طلب ما يصل إلى 64 وحدة إعلانية باستخدام الحدّ الأقصى البالغ maxColorAttachmentBytesPerSample. يُرجى الاطّلاع على المثال التالي وإصدار سمة dawn:2036.

const adapter = await navigator.gpu.requestAdapter();

if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
  // When the desired limit isn't supported, take action to either fall back to
  // a code path that does not require the higher limit or notify the user that
  // their device does not meet minimum requirements.
}

// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
  requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});

تمت زيادة الحدود المسموح بها maxInterStageShaderVariables وmaxInterStageShaderComponents المستخدَمة للتواصل بين المراحل المختلفة على جميع المنصات. يُرجى مراجعة رقم فجر:1448 للحصول على التفاصيل.

وبالنسبة إلى كل مرحلة من مراحل التظليل، يكون الحد الأقصى لعدد إدخالات تنسيق المجموعة في مخطط المسار والذي يمثل مخازن مؤقتة 8 افتراضيًا. ويمكن الآن طلب ما يصل إلى 10 طلبات باستخدام الحدّ الأقصى البالغ maxStorageBuffersPerShaderStage. راجِع عدد الفجر:2159.

تمت إضافة حد جديد بقيمة maxBindGroupsPlusVertexBuffers. ويتكون من الحد الأقصى لعدد خانات مجموعة الربط وخانات التخزين المؤقت الرأسية المستخدمة في وقت واحد، مع حساب أي خانات فارغة أسفل أعلى مؤشر. وقيمتها الافتراضية هي 24. راجِع عدد الفجر:1849.

التغييرات في حالة عمق الاستنسل

لتحسين تجربة المطوِّر، لم تعُد سمتا حالة الاستنسل العميق depthWriteEnabled وdepthCompare مطلوبتين دائمًا: depthWriteEnabled مطلوب فقط للتنسيقات التي لها عمق، ولا يكون depthCompare مطلوبًا للتنسيقات ذات العمق إذا لم يتم استخدامها على الإطلاق. راجِع عدد الفجر:2132.

إشعارات معلومات المحوّل

أصبحت سمات معلومات محوّلَي "type" و"backend" غير العادية متاحة الآن عند طلب requestAdapterInfo() عندما يفعّل المستخدم "ميزات مطوِّر برامج WebGPU". الإبلاغ على chrome://flags/#enable-webgpu-developer-features يمكن أن تكون السمة type "وحدة معالجة رسومات منفصلة" أو "وحدة معالجة رسومات مدمَجة" أو "وحدة معالجة مركزية" أو "غير معروفة". السمة backend هي إما "WebGPU" أو "D3D11" أو "D3D12" أو "metal" أو "vulkan" أو "openGL" أو "openGLES" أو "خالية". راجِع عدد الفجر:2112 وعدد الفجر:2107.

لقطة شاشة للموقع الإلكتروني https://webgpureport.org تعرض معلومات المحوّل وكتابة معلومات الخلفية.
الخلفية الخاصة بمعلومات المحوّل ونوعه كما هو موضَّح على https://webgpureport.org.

تمت إزالة مَعلمة القائمة unmaskHints الاختيارية في requestAdapterInfo(). راجِع عدد الفجر:1427.

قياس كمية طلبات البحث عن الطوابع الزمنية

تتيح طلبات البحث عن الطوابع الزمنية للتطبيقات قياس وقت تنفيذ أوامر وحدة معالجة الرسومات بدقة نانو ثانية. ومع ذلك، تجعل مواصفات WebGPU طلبات البحث عن الطوابع الزمنية اختيارية بسبب مشاكل هجوم الوقت. يعتقد فريق Chrome أنّ تحديد كمية طلبات البحث عن الطوابع الزمنية يوفّر حلاً وسطًا مناسبًا بين الدقة والأمان، وذلك من خلال تقليل درجة الدقة إلى 100 ميكرو ثانية. راجِع عدد الفجر:1800.

في Chrome، يمكن للمستخدمين إيقاف قياس الطوابع الزمنية من خلال تفعيل "ميزات مطوّري برامج WebGPU". flag في chrome://flags/#enable-webgpu-developer-features. تجدر الإشارة إلى أنّ هذه العلامة وحدها لا تفعّل ميزة "timestamp-query". لا يزال تنفيذه في المرحلة التجريبية، وبالتالي يتطلّب استخدام "دعم غير آمن لواجهة برمجة التطبيقات". الإبلاغ عن مشكلة في chrome://flags/#enable-unsafe-webgpu.

في الفجر، تبديل بيانات جهاز جديد باسم "timestamp_quantization" قد تمت إضافتها ويتم تفعيلها افتراضيًا. يوضّح لك المقتطف التالي كيفية السماح بـ "timestamp-query" التجريبي بدون تحديد الكمية للطابع الزمني عند طلب جهاز.

wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};

const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;

const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = &timestampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;

wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};

// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);

ميزات تنظيف الربيع

الطابع التجريبي "timestamp-query-inside-passes" تمت إعادة تسمية الميزة إلى "chromium-experimental-timestamp-query-inside-passes". لتوضيح للمطورين أن هذه الميزة تجريبية ولا تتوفر حاليًا إلا في المتصفحات المستندة إلى Chromium. راجِع عدد الفجر:1193.

يتيح " الاطلاع على إحصاءات البحث" التي تم تنفيذها جزئيًا فقط، تمت إزالتها لأنها لم تعد قيد التطوير. يُرجى الاطّلاع على issue chromium:1177506.

يتناول هذا فقط بعض النقاط الرئيسية. يمكنك الاطّلاع على قائمة الالتزامات الشاملة.

الميزات الجديدة في WebGPU

قائمة بكل ما تم تناوله في سلسلة الميزات الجديدة في WebGPU.

الإصدار 127 من Chrome

الإصدار 126 من Chrome

الإصدار 125 من Chrome

الإصدار 124 من Chrome

الإصدار 123 من Chrome

الإصدار 122 من Chrome

الإصدار 121 من Chrome

الإصدار 120 من Chrome

الإصدار 119 من Chrome

الإصدار 118 من Chrome

الإصدار 117 من Chrome

الإصدار 116 من Chrome

الإصدار 115 من Chrome

الإصدار 114 من Chrome

الإصدار 113 من Chrome