لقد تغيّر الكثير في مجال الذكاء الاصطناعي على الويب خلال العام الماضي. إذا فاتك ذلك، قدّمنا عرضًا تقديميًا في مؤتمر I/O 2024 حول النماذج والأدوات وواجهات برمجة التطبيقات الجديدة لتطبيق الويب التالي.
الذكاء الاصطناعي على الويب هو مجموعة من التكنولوجيات والأساليب التي تتيح استخدام نماذج تعلُّم الآلة (ML) من جهة العميل في متصفّح ويب يعمل على وحدة المعالجة المركزية (CPU) أو وحدة معالجة الرسومات (GPU) في الجهاز. ويمكن إنشاء هذا النوع من التطبيقات باستخدام JavaScript وتكنولوجيات الويب الأخرى، مثل WebAssembly وWebGPU. ويختلف ذلك عن الذكاء الاصطناعي من جهة الخادم أو "الذكاء الاصطناعي المستند إلى السحابة الإلكترونية"، حيث يتم تنفيذ النموذج على خادم ويتم الوصول إليه باستخدام واجهة برمجة تطبيقات.
في هذه الجلسة، شاركنا ما يلي:
- كيفية تشغيل نماذجنا اللغوية الكبيرة الجديدة في المتصفّح وتأثير تشغيل النماذج من جهة العميل
- نظرة على مستقبل الكتل المرئية، بهدف إنشاء نماذج أولية بشكل أسرع
- وكيف يمكن لمطوّري الويب استخدام JavaScript في Chrome للعمل مع Web AI على نطاق واسع.
نماذج اللغات الكبيرة في المتصفّح
Gemma Web هو نموذج جديد مفتوح المصدر من Google يمكن تشغيله في المتصفّح على جهاز المستخدم، وقد تم إنشاؤه بناءً على الأبحاث والتكنولوجيا نفسها التي استخدمناها لإنشاء Gemini.
من خلال توفير نموذج لغوي كبير على الجهاز، يمكن تحقيق وفورات كبيرة في التكاليف مقارنةً بتشغيله على خادم سحابي للاستدلال، بالإضافة إلى تعزيز خصوصية المستخدم وتقليل وقت الاستجابة. لا يزال الذكاء الاصطناعي التوليدي في المتصفّح في مراحله الأولى، ولكن مع استمرار تحسين الأجهزة (من خلال زيادة ذاكرة الوصول العشوائي لوحدة المعالجة المركزية ووحدة معالجة الرسومات)، نتوقّع أن تتوفّر المزيد من النماذج.
يمكن للأنشطة التجارية إعادة تصميم ما يمكنك فعله على صفحة ويب، لا سيما في حالات الاستخدام الخاصة بمهام معيّنة، حيث يمكن ضبط أوزان نماذج اللغات الكبيرة الأصغر (من 2 إلى 8 مليارات مَعلمة) لتشغيلها على أجهزة المستهلكين.
يمكن تنزيل Gemma 2B من Kaggle Models، وهو متوافق مع Web LLM inference API. تشمل البُنى الأساسية الأخرى المتوافقة Microsoft Phi-2 وFalcon RW 1B وStable LM 3B، ويمكنك تحويلها إلى تنسيق يمكن أن يستخدمه وقت التشغيل باستخدام مكتبة المحوّل.
إنشاء نماذج أولية أسرع باستخدام "الكتل المرئية"
نتعاون مع Hugging Face، التي أنشأت 16 عقدة مخصّصة جديدة تمامًا لـ Visual Blocks. يؤدي ذلك إلى دمج Transformers.js ونظام Hugging Face المتكامل الأوسع نطاقًا في "اللبنات المرئية".
تعمل ثماني من هذه العُقد الجديدة بالكامل من جهة العميل، وذلك باستخدام Web AI، وتشمل:
بالإضافة إلى ذلك، هناك سبع مهام تعلُّم آلة من جهة الخادم من Hugging Face تتيح لك تشغيل آلاف النماذج باستخدام واجهات برمجة التطبيقات في "اللبنات المرئية". يمكنك الاطّلاع على مجموعة Hugging Face Visual Blocks.
استخدام JavaScript للذكاء الاصطناعي على الويب على نطاق واسع باستخدام Chrome
في النماذج السابقة، مثل Gemma، يتم تحميل النموذج وتشغيله داخل صفحة الويب نفسها. يعمل Chrome على تطوير ذكاء اصطناعي مدمج يعمل على الجهاز فقط، حيث يمكنك الوصول إلى النماذج باستخدام واجهات برمجة تطبيقات JavaScript موحّدة ومخصّصة لمهام معيّنة.
وهذا ليس كل ما في الأمر. عدّل Chrome أيضًا WebGPU ليصبح متوافقًا مع قيم الفاصلة العائمة ذات 16 بت.
تقدّم WebAssembly اقتراحًا جديدًا، وهو Memory64، لإتاحة استخدام فهارس ذاكرة 64 بت، ما يتيح لك تحميل نماذج ذكاء اصطناعي أكبر من ذي قبل.
بدء اختبار نماذج الذكاء الاصطناعي على الويب باستخدام Chrome بدون واجهة مستخدم رسومية
يمكنك الآن اختبار الذكاء الاصطناعي من جهة العميل (أو أي تطبيق يحتاج إلى توافق WebGL أو WebGPU) باستخدام Headless Chrome، مع الاستفادة من وحدات معالجة الرسومات من جهة الخادم لتسريع الأداء، مثل NVIDIA T4 أو P100. مزيد من المعلومات:
- تشغيلها في Google Colab
- قراءة بيانات مفصّلة عن الاختبارات
- يمكنك أيضًا الاطّلاع على مثال الرمز البرمجي على GitHub.
تذكَّر أنّه عند مشاركة المحتوى الذي تصنعه، عليك إضافة الهاشتاغ #WebAI ليتمكّن المنتدى الأوسع من الاطّلاع على عملك. يمكنك مشاركة النتائج والاقتراحات على X أو LinkedIn أو منصة التواصل الاجتماعي المفضّلة لديك.