الميزات الجديدة في WebGPU (Chrome 123)

François Beaufort
François Beaufort

إتاحة الدوالّ المدمَجة في DP4a في WGSL

يشير DP4a (منتج النقطة لـ 4 عناصر والتراكم) إلى مجموعة من تعليمات وحدة معالجة الرسومات التي يشيع استخدامها في استنتاج التعلم المتعمق للقياس الكمي. فهي تعمل بكفاءة على تنفيذ منتجات نقاط تتضمّن أعدادًا صحيحةً تبلغ 8 بت لتسريع عملية احتساب هذه النماذج المحدّدة بـ int8. ويمكن أن توفّر (ما يصل إلى %75) من الذاكرة وسعة النطاق في الشبكة، كما يمكنها تحسين أداء أي نماذج تعلُّم آلة في الاستنتاج مقارنةً بإصدار f32. ونتيجةً لذلك، يتم استخدامه الآن بشكل كبير في العديد من إطارات عمل الذكاء الاصطناعي الشائعة.

عند توفُّر إضافة اللغة WGSL "packed_4x8_integer_dot_product" في navigator.gpu.wgslLanguageFeatures، يمكنك الآن استخدام مقاييس أعداد صحيحة 32 بت تضم متّجِهات مكونة من 4 مكوّنات من أعداد صحيحة 8 بت كمدخلات إلى تعليمات منتج النقطة في رمز أداة تظليل WGSL مع الدالتَين dot4U8Packed وdot4I8Packed المُدمجتَين. يمكنك أيضًا استخدام تعليمات الحزم وتفريغها باستخدام ناقلات مُجمَّعة من 4 مكوّنات من الأعداد الصحيحة المكوّنة من 8 بت باستخدام الدوالّ المضمّنة WGSL‏ pack4xI8 وpack4xU8 وpack4xI8Clamp وpack4xU8Clamp وunpack4xI8 وunpack4xU8.

ننصحك باستخدام توجيه requires للإشارة إلى احتمال عدم إمكانية النقل باستخدام requires packed_4x8_integer_dot_product; في أعلى رمز برنامج Shader لـ WGSL. راجِع المثال التالي وissue tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

نشكر بشكل خاص فريق Web Graphics في Intel في شنغهاي على إنجاز هذه المواصفات وتنفيذها.

معلَمات المؤشر غير المحدودة في WGSL

تعمل "unrestricted_pointer_parameters" إضافة اللغة WGSL على تخفيف القيود المفروضة على المؤشرات التي يمكن تمريرها إلى دوال WGSL:

  • تشير مؤشرات المَعلمات storage وuniform وworkgroup إلى مساحات عناوين الدوال التي يعلن عنها المستخدم.

  • تمرير مؤشرات إلى عناصر البنية وعناصر الصفيف إلى الدوالّ التي يعلن عنها المستخدم

اطّلِع على المؤشرات كمَعلمات للدوالّ | جولة في WGSL لمعرفة المزيد من المعلومات.

يمكن اكتشاف هذه الميزة باستخدام navigator.gpu.wgslLanguageFeatures. نقترح استخدام يتطلب التوجيه دائمًا للإشارة إلى إمكانية عدم قابلية النقل باستخدام requires unrestricted_pointer_parameters; في أعلى رمز أداة تظليل WGSL. راجِع المثال التالي وتغييرات مواصفات WGSL وissue tint:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

تحسينات في بنية الجملة لإزالة الإشارة إلى العناصر المركبة في WGSL

عندما تكون "pointer_composite_access" إضافة اللغة WGSL متوفّرة في navigator.gpu.wgslLanguageFeatures، يتيح لك الآن رمز مخطّط الإضاءة WGSL الوصول إلى مكوّنات أنواع البيانات المعقدة باستخدام بنية النقطة (.) نفسها، سواء كنت تعمل مع البيانات مباشرةً أو مع مؤشر إليها. إليك آلية العمل:

  • إذا كان foo مؤشرًا: foo.bar هو طريقة أكثر ملاءمةً لكتابة (*foo).bar. عادةً ما يكون النجمة (*) مطلوبًا لتحويل المؤشر إلى "مرجع" يمكن إلغاء مرجعيته، ولكنّ المؤشرات والمرجعات الآن متشابهة أكثر بكثير ويمكن تبديلها تقريبًا.

  • إذا لم يكن foo مؤشرًا: يعمل عامل النقطة (.) تمامًا كما اعتدت عليه للوصول مباشرةً إلى العناصر.

وبالمثل، إذا كان pa مؤشرًا يخزِّن العنوان الأوّلي لمجموعة، فإنّ استخدام pa[i] يمنحك إمكانية الوصول مباشرةً إلى مكان الذاكرة الذي يتم فيه تخزين العنصر 'i من هذه المجموعة.

ننصحك باستخدام توجيه requires للإشارة إلى احتمال عدم إمكانية النقل باستخدام requires pointer_composite_access; في أعلى رمز برنامج Shader لـ WGSL. راجِع المثال التالي وissue tint:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

حالة قراءة فقط منفصلة لآراء الاستنسل والعمق

في السابق، كانت مرفقات استنسل العمق للقراءة فقط في بطاقات العرض تتطلب أن يكون كلا الجانبين (العمق والاستنسل) للقراءة فقط. وقد تم رفع هذا القيد. يمكنك الآن استخدام سمة العمق بأسلوب القراءة فقط، مثلاً لتتبُّع ظلال الأجسام، بينما يتمّ كتابة مخزن الاستنسل لتحديد البكسلات لإجراء المزيد من المعالجة. راجِع عدد الفجر:2146.

آخر الأخبار من Dawn

يتم الآن استدعاء مجموعة معاودة الاتصال للخطأ التي لم يتم التقاطها باستخدام wgpuDeviceSetUncapturedErrorCallback() فورًا عند حدوث الخطأ. وهذا ما يتوقعه المطوّرون باستمرار ويريدونه لأغراض تصحيح الأخطاء. راجِع change dawn:173620.

تم تنفيذ الطريقة wgpuSurfaceGetPreferredFormat() من واجهة برمجة التطبيقات webgpu.h API. راجِع issue dawn:1362.

لا يتناول هذا التقرير سوى بعض أهم التفاصيل. اطّلِع على قائمة المساهمين الشاملة.

الميزات الجديدة في WebGPU

قائمة بكل ما تم تناوله في سلسلة الميزات الجديدة في WebGPU

Chrome 131

الإصدار 130 من Chrome

الإصدار 129 من Chrome

Chrome 128

الإصدار 127 من Chrome

الإصدار 126 من Chrome

الإصدار 125 من Chrome

Chrome 124

Chrome 123

Chrome 122

الإصدار 121 من Chrome

الإصدار 120 من Chrome

الإصدار 119 من Chrome

Chrome 118

Chrome 117

الإصدار 116 من Chrome

Chrome 115

الإصدار 114 من Chrome

Chrome 113