ملخص مؤتمر I/O لعام 2024 Web AI: نماذج وأدوات وواجهات برمجة تطبيقات جديدة لتطبيق الويب التالي

طرأت تغييرات كثيرة على الذكاء الاصطناعي على الويب خلال العام الماضي. إذا لم تتمكن من حضور المحادثة، يمكنك الاطّلاع على تسجيلها. لقد قدّمنا في مؤتمر I/O لعام 2024 مناقشة عن النماذج والأدوات وواجهات برمجة التطبيقات الجديدة لتطبيق الويب التالي.

الذكاء الاصطناعي على الويب هو مجموعة من التقنيات والأساليب لاستخدام نماذج تعلُّم الآلة (ML) من جهة العميل في متصفّح ويب يعمل على وحدة المعالجة المركزية (CPU) أو وحدة معالجة الرسومات (GPU) للجهاز. ويمكن إنشاء هذه التطبيقات باستخدام JavaScript وتكنولوجيات الويب الأخرى، مثل WebAssembly وWebGPU. يختلف ذلك عن الذكاء الاصطناعي من جهة الخادم أو "الذكاء الاصطناعي من السحابة الإلكترونية"، حيث يتم تنفيذ النموذج على خادم ويتم الوصول إليه باستخدام واجهة برمجة تطبيقات.

في هذه المحادثة، شاركنا ما يلي:

  • كيفية تشغيل النماذج اللغوية الكبيرة الجديدة في المتصفّح وتأثير تشغيل النماذج من جهة العميل
  • نظرة على مستقبل العناصر المرئية ل prototyping بشكل أسرع
  • وكيفية استخدام مطوّري الويب لـ JavaScript في Chrome للعمل مع تكنولوجيات الذكاء الاصطناعي على الويب، على نطاق واسع

النماذج اللغوية الكبيرة في المتصفّح

‫Gemma Web هو نموذج جديد مفتوح من Google يمكن تشغيله في المتصفّح على جهاز المستخدم، وقد تم إنشاؤه استنادًا إلى الأبحاث والتكنولوجيا نفسها المستخدَمة في إنشاء Gemini.

من خلال توفير نموذج لغوي كبير على الجهاز، يمكن تحقيق وفورات كبيرة في التكلفة مقارنةً بتشغيله على خادم في السحابة الإلكترونية لإجراء الاستنتاجات، بالإضافة إلى تحسين خصوصية المستخدم وخفض وقت الاستجابة. لا تزال تقنية الذكاء الاصطناعي التوليدي في المتصفّح في مراحلها الأولى، ولكن مع استمرار تحسين الأجهزة (من خلال زيادة ذاكرة الوصول العشوائي لوحدة المعالجة المركزية ووحدة معالجة الرسومات)، نتوقّع توفّر المزيد من النماذج.

يمكن للأنشطة التجارية إعادة تصور ما يمكنك فعله على صفحة ويب، خاصةً في حالات الاستخدام الخاصة بالمهام، حيث يمكن ضبط أوزان النماذج اللغوية الكبيرة الأصغر حجمًا (من مليارَين إلى 8 مليارات مَعلمة) لتشغيلها على أجهزة المستهلك.

يمكنك تنزيل Gemma 2B على نماذج Kaggle، وهو متاح بتنسيق متوافق مع واجهة برمجة التطبيقات لتحليل النماذج اللغوية الكبيرة على الويب. تشمل التصاميم الأخرى المتوافقة Microsoft Phi-2 وFalcon RW 1B وStable LM 3B، ويمكنك تحويلها إلى تنسيق يمكن لوقت التشغيل استخدامه باستخدام مكتبة المحوِّل.

إنشاء نماذج أولية بشكل أسرع باستخدام Visual Blocks

باستخدام Visual Blocks، يمكنك إجراء عملية تقدير العمق في العميل بدون استخدام أي رمز.

نحن نتعاون مع Hugging Face، التي أنشأت 16 عقدة مخصّصة جديدة للكتل المرئية. ويؤدي ذلك إلى توفير Transformers.js ومنظومة Hugging Face المتكاملة الأوسع نطاقًا في Visual Blocks.

يتم تشغيل ثماني من هذه العقد الجديدة بالكامل من جهة العميل، باستخدام الذكاء الاصطناعي على الويب، بما في ذلك:

بالإضافة إلى ذلك، هناك سبع مهام تعلُّم آلي من جهة الخادم من Hugging Face تتيح لك تشغيل آلاف النماذج باستخدام واجهات برمجة التطبيقات في Visual Blocks. اطّلِع على مجموعة "الحجبات المرئية للوجوه التي تعانق بعضها".

استخدام JavaScript للذكاء الاصطناعي على الويب على نطاق واسع باستخدام Chrome

في الحالات السابقة، مثل حالة "جيما"، يتم تحميل النموذج وتشغيله داخل صفحة الويب نفسها. يعمل Chrome على تطوير ميزات الذكاء الاصطناعي المدمجة على الجهاز، والتي تتيح لك الوصول إلى النماذج باستخدام واجهة برمجة تطبيقات JavaScript موحّدة ومخصّصة للمهام.

ولم نتوقف عن هذا الحدّ. عدّل Chrome أيضًا WebGPU ليتوافق مع قيم النقطة الثابتة المكوّنة من 16 بت.

لدى WebAssembly اقتراح جديد، وهو Memory64، لسماح بتحميل نماذج الذكاء الاصطناعي بحجم أكبر مما كان عليه من قبل، وذلك من خلال فهرسة الذاكرة بسعة 64 بت.

بدء اختبار نماذج الذكاء الاصطناعي على الويب باستخدام Chrome بدون واجهة مستخدم

يمكنك الآن اختبار الذكاء الاصطناعي من جهة العميل (أو أي تطبيق يحتاج إلى WebGL أو WebGPU ) باستخدام Headless Chrome، مع الاستفادة من وحدات معالجة الرسومات من جهة الخادم لزيادة السرعة، مثل NVIDIA T4 أو P100. اطّلِع على مزيد من المعلومات:

عند مشاركة أعمالك، احرص على إضافة ‎ #WebAI حتى يتمكّن المنتدى الأوسع من الاطّلاع عليها. شارِك النتائج والاقتراحات على X أو LinkedIn أو منصة الصعق الاجتماعي المفضّلة لديك.