الميزات الجديدة في WebGPU (Chrome 123)

François Beaufort
François Beaufort

إتاحة الدوالّ المدمَجة في DP4a في WGSL

يشير DP4a (حاصل ضرب نقطي لـ 4 عناصر وعمليات تجميع) إلى مجموعة من تعليمات وحدة معالجة الرسومات (GPU) المستخدَمة بشكل شائع في الاستنتاج بالاستناد إلى التعلم العميق لعملية التقليل. ويُجري هذا الإجراء بكفاءة منتجات نقطية صحيحة بسعة 8 بت لتسريع احتساب هذه النماذج التي تم تجميعها بدقة int8. ويمكن أن توفّر (ما يصل إلى %75) من الذاكرة وسعة النطاق في الشبكة، كما يمكنها تحسين أداء أي نماذج تعلُّم آلة في الاستنتاج مقارنةً بإصدار f32. ونتيجةً لذلك، يتم استخدامه الآن بشكل كبير في العديد من إطارات عمل الذكاء الاصطناعي الشائعة.

عندما تكون "packed_4x8_integer_dot_product" إضافة اللغة WGSL متوفّرة في navigator.gpu.wgslLanguageFeatures، يمكنك الآن استخدام أعداد صحيحة قياسية 32 بت تحزِّم متجهات من 4 مكوّنات من الأعداد الصحيحة 8 بت كمدخلات لتعليمات المنتج النقطي في رمز برنامج Shader الخاص بـ WGSL باستخدام الدالتَين المضمّنتَين dot4U8Packed وdot4I8Packed. يمكنك أيضًا استخدام تعليمات الحزم وتفريغها باستخدام ناقلات مُجمَّعة من 4 مكوّنات من الأعداد الصحيحة المكونة من 8 بت باستخدام الدوالّ المضمّنة في WGSL‏ pack4xI8 وpack4xU8 وpack4xI8Clamp وpack4xU8Clamp وunpack4xI8 وunpack4xU8.

ننصحك باستخدام توجيه requires للإشارة إلى احتمال عدم إمكانية النقل باستخدام requires packed_4x8_integer_dot_product; في أعلى رمز برنامج Shader لـ WGSL. راجِع المثال التالي وissue tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

نشكر بشكل خاص فريق Web Graphics في Intel في شنغهاي على إنجاز هذه المواصفات وتنفيذها.

مَعلمات المؤشر غير المقيّدة في WGSL

تعمل "unrestricted_pointer_parameters" إضافة اللغة WGSL على تخفيف القيود المفروضة على المؤشرات التي يمكن تمريرها إلى دوال WGSL:

  • تشير مؤشرات المَعلمات storage وuniform وworkgroup إلى مساحات الدوال التي يعلن عنها المستخدم.

  • تمرير مؤشرات إلى عناصر البنية وعناصر الصفيف إلى الدوالّ التي يعلن عنها المستخدم

اطّلِع على المؤشرات كمَعلمات للدوالّ | جولة في WGSL لمعرفة المزيد من المعلومات.

يمكن رصد هذه الميزة باستخدام navigator.gpu.wgslLanguageFeatures. ننصحك باستخدام توجيه requires دائمًا للإشارة إلى احتمال عدم إمكانية النقل باستخدام requires unrestricted_pointer_parameters; في أعلى رمز برنامج Shader لـ WGSL. راجِع المثال التالي وتغييرات مواصفات WGSL وissue tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

تحسينات في بنية الجملة لإزالة الإشارة إلى العناصر المركبة في WGSL

عندما تكون "pointer_composite_access" إضافة اللغة WGSL متوفّرة في navigator.gpu.wgslLanguageFeatures، يتيح لك الآن رمز مخطِّط الإضاءة WGSL الوصول إلى مكوّنات أنواع البيانات المعقدة باستخدام بنية النقطة (.) نفسها، سواء كنت تعمل مع البيانات مباشرةً أو مع مؤشر إليها. إليك آلية العمل:

  • إذا كان foo مؤشرًا: foo.bar هو طريقة أكثر ملاءمةً لكتابة (*foo).bar. عادةً ما تكون النجمة (*) مطلوبة لتحويل المؤشر إلى "مرجع" يمكن إلغاء مرجعيته، ولكنّ المؤشرات والمرجعات متشابهة الآن بشكلٍ أكبر ويمكن تبديلها تقريبًا.

  • إذا لم يكن foo مؤشرًا: يعمل عامل النقطة (.) تمامًا كما اعتدت عليه للوصول مباشرةً إلى العناصر.

وبالمثل، إذا كان pa مؤشرًا يخزِّن العنوان الأوّلي لمجموعة، فإنّ استخدام pa[i] يمنحك إمكانية الوصول مباشرةً إلى مكان الذاكرة الذي يتم فيه تخزين العنصر 'i من هذه المجموعة.

ننصحك باستخدام توجيه requires للإشارة إلى احتمال عدم إمكانية النقل باستخدام requires pointer_composite_access; في أعلى رمز برنامج Shader لـ WGSL. راجِع المثال التالي وissue tint:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

حالة قراءة فقط منفصلة لآراء الاستنسل والعمق

في السابق، كانت مرفقات "نقش الصورة" للقراءة فقط في عمليات التقديم تتطلّب أن يكون كلا الجانبَين ("عمق الصورة" و"نقش الصورة") للقراءة فقط. وقد تم رفع هذا القيد. يمكنك الآن استخدام سمة العمق بأسلوب القراءة فقط، مثلاً لتتبُّع ظلال الأجسام، بينما يتم كتابة مخزن الاستنسل لتحديد البكسلات لإجراء المزيد من المعالجة. اطّلِع على الإصدار dawn:2146.

آخر الأخبار من Dawn

يتم الآن استدعاء دالة الاستدعاء غير المسجَّلة للخطأ التي تم ضبطها باستخدام wgpuDeviceSetUncapturedErrorCallback() على الفور عند حدوث الخطأ. وهذا ما يتوقعه المطوّرون باستمرار ويريدونه لأغراض تصحيح الأخطاء. راجِع change dawn:173620.

تم تنفيذ الطريقة wgpuSurfaceGetPreferredFormat() من واجهة برمجة التطبيقات webgpu.h. راجِع issue dawn:1362.

لا يتناول هذا التقرير سوى بعض أهم التفاصيل. اطّلِع على قائمة المساهمين الشاملة.

الميزات الجديدة في WebGPU

قائمة بكل ما تم تناوله في سلسلة الميزات الجديدة في WebGPU

Chrome 132

Chrome 131

Chrome 130

الإصدار 129 من Chrome

Chrome 128

الإصدار 127 من Chrome

الإصدار 126 من Chrome

الإصدار 125 من Chrome

Chrome 124

Chrome 123

Chrome 122

الإصدار 121 من Chrome

الإصدار 120 من Chrome

الإصدار 119 من Chrome

Chrome 118

Chrome 117

Chrome 116

Chrome 115

الإصدار 114 من Chrome

Chrome 113