أجرينا تغييرات كثيرة على الذكاء الاصطناعي على الويب خلال العام الماضي. إذا فاتتك هذه المعلومات، ألقينا محادثة في مؤتمر I/O لعام 2024 حول النماذج والأدوات وواجهات برمجة التطبيقات الجديدة لتطبيق الويب التالي.
تكنولوجيات الذكاء الاصطناعي على الويب هي مجموعة من التكنولوجيات والتقنيات لاستخدام نماذج تعلُّم الآلة (ML) من جهة العميل في متصفّح ويب يعمل على وحدة المعالجة المركزية (CPU) أو وحدة معالجة الرسومات في الجهاز. ويمكن إنشاء هذا باستخدام JavaScript وتكنولوجيات الويب الأخرى، مثل WebAssembly وWebGPU. ويختلف هذا عن الذكاء الاصطناعي من جهة الخادم أو "الذكاء الاصطناعي في السحابة الإلكترونية" حيث يتم تنفيذ النموذج على خادم ويتم الوصول إليه باستخدام واجهة برمجة التطبيقات.
في هذا الحديث، شاركنا ما يلي:
- كيفية استخدام النماذج اللغوية الكبيرة الجديدة في المتصفّح وتأثير تشغيل النماذج من جهة العميل
- نظرة على مستقبل القوالب المرئية لإنشاء نماذج أولية بشكل أسرع
- وكيف يمكن لمطوّري الويب استخدام JavaScript في Chrome للعمل مع الذكاء الاصطناعي على الويب على نطاق واسع.
النماذج اللغوية الكبيرة في المتصفّح
Gemma Web هو نموذج مفتوح جديد من Google يمكن تشغيله في المتصفح على جهاز المستخدم، وتم إنشاؤه من نفس البحث والتكنولوجيا التي استخدمناها لإنشاء Gemini.
ومن خلال توفير النموذج اللغوي الكبير على الجهاز، يمكن توفير التكاليف بشكل كبير مقارنةً بتشغيله على خادم سحابي، فضلاً عن تحسين خصوصية المستخدم وتقليل وقت الاستجابة. لا يزال الذكاء الاصطناعي التوليدي في المتصفّح في مراحله الأولى، ولكن مع استمرار تحسُّن أداء الأجهزة (مع زيادة معدّل استخدام وحدة المعالجة المركزية (CPU) وذاكرة الوصول العشوائي GPU)، نتوقّع أن يتوفّر المزيد من الطُرز.
بإمكان الأنشطة التجارية إعادة تصميم ما يمكنك فعله على صفحة ويب، لا سيّما في حالات الاستخدام المتعلّقة بمهام معيّنة، حيث يمكن ضبط أوزان النماذج اللغوية الكبيرة الأصغر (من 2 إلى 8 مليار مَعلمة) لعرضها على أجهزة المستهلكين.
تتوفّر لعبة Gemma 2B للتنزيل على طُرز Kaggle، وهي بتنسيق متوافق مع Web LLM Inference API. وتشمل البُنى الأساسية الأخرى المتوافقة Microsoft Phi-2 وFalcon RW 1B وStable LM 3B، التي يمكنك تحويلها إلى تنسيق يمكن استخدامه في وقت التشغيل باستخدام مكتبة المحوّلات.
إنشاء نماذج أولية أسرع باستخدام "القوالب المرئية"
نتعاون حاليًا مع ميزة Hugging Face التي أنشأَت 16 عقدة مخصَّصة جديدة تمامًا للعبة Visual Blocks. يتيح ذلك استخدام Transformers.js والمنظومة المتكاملة Hugging Face الأوسع نطاقًا في تطبيق Visual Blocks.
تعمل ثماني من هذه العُقد الجديدة بالكامل من جهة العميل، باستخدام الذكاء الاصطناعي على الويب، بما في ذلك:
- تقسيم الصور
- الترجمة
- تصنيف الرموز المميّزة
- رصد العناصر
- تصنيف النص
- إزالة المحتوى في الخلفية
- تقدير العمق
بالإضافة إلى ذلك، هناك سبع مهام تعلُّم الآلة من جهة الخادم من Hugging Face تتيح لك تشغيل آلاف النماذج باستخدام واجهات برمجة التطبيقات في تطبيق Visual Blocks. يمكنك الاطّلاع على مجموعة Hugging Face Visual Blocks.
استخدام JavaScript للذكاء الاصطناعي على الويب على نطاق واسع من خلال Chrome
في الحالات السابقة، كما هو الحال مع "جيما"، يتم تحميل النموذج وتشغيله داخل صفحة الويب نفسها. يعمل Chrome على الذكاء الاصطناعي (AI) مضمّن على الجهاز، حيث يمكنك الوصول إلى النماذج باستخدام واجهات برمجة تطبيقات JavaScript الموحّدة والمخصّصة للمهام.
ولم نتوقف عن هذا الحدّ. قام Chrome أيضًا بتحديث WebGPU بتوافق مع قيم النقاط العائمة 16 بت.
تقدّم WebAssembly اقتراحًا جديدًا، وهو Memory64، يتوافق مع فهارس الذاكرة 64 بت التي تتيح لك تحميل نماذج ذكاء اصطناعي (AI) أكبر من ذي قبل.
بدء اختبار نماذج الذكاء الاصطناعي على الويب باستخدام Chrome بلا واجهة مستخدم رسومية
يمكنك الآن اختبار الذكاء الاصطناعي من جهة العميل (أو أي تطبيق يتطلّب التوافق مع WebGL أو WebGPU) باستخدام Chrome بلا واجهة مستخدم رسومية، مع الاستفادة في الوقت نفسه من وحدات معالجة الرسومات من جهة الخادم للتسريع مثل NVIDIA T4 أو P100 مزيد من المعلومات:
- تشغيله في Google Colab
- قراءة معلومات تفصيلية عن الاختبارات
- ويمكنك الاطّلاع على مثال الرمز على GitHub
عند مشاركة المحتوى الذي تنشئه، أضِف #WebAI ليتمكّن أفراد المنتدى الأوسع من رؤية عملك. شارك نتائجك واقتراحاتك على X أو LinkedIn أو المنصة الاجتماعية التي تفضلها.