الذكاء الاصطناعي المدمَج

Kenji Baheux
Kenji Baheux
Alexandra Klepper
Alexandra Klepper

عندما ننشئ ميزات باستخدام نماذج الذكاء الاصطناعي (AI) على الويب، نعتمد غالبًا على الحلول من جهة الخادم للطُرز الأكبر حجمًا. وينطبق ذلك بشكل خاص على الذكاء الاصطناعي التوليدي، إذ تكون حتى أصغر النماذج بحجم أكبر بحوالي ألف مرة من متوسط حجم صفحة الويب. وينطبق ذلك أيضًا على حالات استخدام الذكاء الاصطناعي الأخرى، حيث تتراوح مدة النماذج بين 10 ثوانٍ و100 ثانية من الميغابايت.

بما أنّ هذه النماذج لا تتم مشاركتها على المواقع الإلكترونية، على كل موقع إلكتروني تنزيلها عند تحميل الصفحة. هذا حل غير عملي للمطورين والمستخدمين

في حين أنّ الذكاء الاصطناعي من جهة الخادم هو خيار رائع للطُرز الكبيرة، فإنّ المناهج على الجهاز والأساليب المختلطة لها مزاياها الإيجابية. لجعل هذه الأساليب قابلة للتطبيق، نحتاج إلى معالجة حجم النموذج وعرض النموذج.

لهذا السبب، نعمل على تطوير واجهات برمجة تطبيقات لمنصة الويب وميزات المتصفّح مصمَّمة لدمج نماذج الذكاء الاصطناعي (AI)، بما في ذلك النماذج اللغوية الكبيرة (LLM)، مباشرةً في المتصفّح. ويشمل ذلك الإصدار Gemini Nano، وهو الإصدار الأكثر فعالية من مجموعة Gemini بتنسيقات LLM، وهو مصمّم للعمل محليًا على معظم أجهزة الكمبيوتر المكتبي وأجهزة الكمبيوتر المحمولة الحديثة. باستخدام الذكاء الاصطناعي المدمَج، يمكن لموقعك الإلكتروني أو تطبيق الويب تنفيذ مهام مستندة إلى الذكاء الاصطناعي بدون الحاجة إلى نشر نماذج الذكاء الاصطناعي الخاصة به أو إدارتها.

تعرَّف على مزايا الذكاء الاصطناعي المدمَج وخطة التنفيذ وكيفية الاستفادة من هذه التكنولوجيا.

استفِد من معاينة مبكرة

نحتاج إلى آرائك لتطوير واجهات برمجة التطبيقات وضمان استيفائها لحالات الاستخدام وإثراء مناقشاتنا مع مورّدي المتصفحات الآخرين بهدف توحيد المقاييس.

ندعوك للانضمام إلى برنامج المعاينة المبكر لتقديم ملاحظات حول أفكار الذكاء الاصطناعي المدمَجة في المراحل الأولى، واستكشاف فرص اختبار واجهات برمجة التطبيقات قيد التقدم من خلال النماذج الأولية المحلية.

انضم إلى مجموعة الإشعارات العامة الخاصة بمطوّري تقنيات الذكاء الاصطناعي في Chrome لتتلقّى إشعارًا عند توفُّر واجهات برمجة تطبيقات جديدة.

مزايا الذكاء الاصطناعي المضمَّنة للمطوّرين على الويب

باستخدام الذكاء الاصطناعي المدمَج، يوفِّر متصفّحك ويدير نماذج الأساس والخبراء.

مقارنةً بإجراء ذلك بنفسك باستخدام الذكاء الاصطناعي على الجهاز، يوفّر الذكاء الاصطناعي المدمَج المزايا التالية:

  • سهولة النشر: عندما يوزّع المتصفّح النماذج، يأخذ في الاعتبار إمكانات الجهاز ويدير تحديثات النموذج. وهذا يعني أنك لست مسئولاً عن تنزيل أو تحديث النماذج الكبيرة عبر إحدى الشبكات. لن تضطر إلى معالجة إخلاء مساحة التخزين وميزانية ذاكرة وقت التشغيل وتكاليف العرض وغيرها من التحديات.
  • إمكانية الوصول إلى تسريع الأجهزة: تم تحسين وقت تشغيل الذكاء الاصطناعي في المتصفّح للاستفادة إلى أقصى حد من الأجهزة المتاحة، سواء كانت وحدة معالجة رسومات أو وحدة معالجة مركزية (NPU) أو استخدام وحدة المعالجة المركزية (CPU). وبالتالي، يمكن لتطبيقك تحقيق أفضل أداء على كل جهاز.

مزايا الجري على الجهاز

باستخدام نهج الذكاء الاصطناعي المدمَج، يصبح أداء مهام الذكاء الاصطناعي على الجهاز أمرًا بسيطًا، ما يؤدي بدوره إلى تحقيق المزايا التالية:

  • المعالجة المحلية للبيانات الحساسة: يمكن للذكاء الاصطناعي على الجهاز أن يحسِّن قصة الخصوصية. على سبيل المثال، إذا كنت تتعامل مع البيانات الحساسة، يمكنك توفير ميزات الذكاء الاصطناعي (AI) للمستخدمين من خلال التشفير التام بين الأطراف.
  • تجربة المستخدم السريعة: في بعض الحالات، يعني إيقاف الانتقال إلى الخادم أنّه يمكنك تقديم نتائج شبه فورية. يمكن أن يمثل الذكاء الاصطناعي على الجهاز الفرق بين ميزة قابلة للتطبيق وتجربة مستخدم دون المستوى الأمثل.
  • وصول أكبر إلى الذكاء الاصطناعي: يمكن لأجهزة المستخدمين تحمّل بعض أعباء المعالجة مقابل وصول أكبر إلى الميزات. على سبيل المثال، إذا كنت توفّر ميزات الذكاء الاصطناعي (AI) المدفوعة، يمكنك معاينتها باستخدام الذكاء الاصطناعي على الجهاز حتى يتمكّن العملاء المحتملون من الاطّلاع على مزايا منتجك، بدون تحمّل أيّ تكلفة إضافية. يمكن أن يساعدك هذا النهج المختلط أيضًا في إدارة تكاليف الاستنتاج خاصة على تدفقات المستخدم المستخدمة بشكل متكرر.
  • استخدام الذكاء الاصطناعي بلا إنترنت: يمكن للمستخدمين الوصول إلى ميزات الذكاء الاصطناعي حتى في حال عدم توفّر اتصال بالإنترنت. هذا يعني أنّ مواقعك الإلكترونية وتطبيقاتك على الويب يمكن أن تعمل على النحو المتوقّع في وضع عدم الاتصال أو باستخدام اتصال متغير.

الذكاء الاصطناعي المختلط: على الجهاز ومن جهة الخادم

بإمكان الذكاء الاصطناعي على الجهاز التعامل مع مجموعة كبيرة من حالات الاستخدام، إلا أنّ هناك بعض حالات الاستخدام التي تتطلّب توفير الدعم من جهة الخادم.

على سبيل المثال، قد تحتاج إلى استخدام طُرز أكبر أو دعم مجموعة أكبر من الأنظمة الأساسية والأجهزة.

يمكنك التفكير في مناهج مختلطة، تعتمد على:

  • التعقيد: من الأسهل استخدام الذكاء الاصطناعي على الجهاز في حالات استخدام محدّدة يسهل الوصول إليها. بالنسبة إلى حالات الاستخدام المعقّدة، ننصحك بالتنفيذ من جهة الخادم.
  • المرونة: استخدِم الخدمة من جهة الخادم تلقائيًا، واستخدِمها على الجهاز فقط عندما يكون الجهاز غير متصل بالإنترنت أو متصلاً بالإنترنت بشكل متقطع.
  • إجراء احتياطي سلس: سيستغرق استخدام المتصفّحات المزوّدة بالذكاء الاصطناعي (AI) بعض الوقت، وقد تكون بعض الطُرز غير متاحة، وقد لا تستوفي الأجهزة القديمة أو الأقل قوة متطلبات الأجهزة لتشغيل جميع الطُرز على النحو الأمثل. توفير الذكاء الاصطناعي من جهة الخادم لهؤلاء المستخدمين

بالنسبة إلى طُرز Gemini، يمكنك استخدام ميزة الدمج مع الواجهة الخلفية (مع Python أو Go أو Node.js أو REST) أو تنفيذ عملية الدمج في تطبيق الويب باستخدام حزمة تطوير البرامج (SDK) الجديدة لعميل الذكاء الاصطناعي من Google للويب.

بنية المتصفّح وواجهات برمجة التطبيقات

لدعم الذكاء الاصطناعي المدمَج في Chrome، أنشأنا بنية أساسية للوصول إلى النماذج الأساسية والنماذج الخبيرة للتنفيذ على الجهاز. توفّر هذه البنية الأساسية حاليًا ميزات مبتكرة للمتصفّح، مثل ميزة المساعدة في الكتابة، وستفعّل قريبًا واجهات برمجة التطبيقات المستندة إلى الذكاء الاصطناعي على الأجهزة.

ستتمكّن بشكل أساسي من الوصول إلى إمكانات الذكاء الاصطناعي المدمَجة من خلال واجهات برمجة التطبيقات للمهام، مثل واجهة برمجة تطبيقات الترجمة أو واجهة برمجة التطبيقات للتلخيص. تم تصميم واجهات برمجة تطبيقات المهام لإجراء الاستنتاج مقابل أفضل نموذج للمهمة.

في Chrome، تم تصميم واجهات برمجة التطبيقات هذه لإجراء الاستنتاج مقابل Gemini Nano من خلال ضبط دقيق أو نموذج متخصّص. تم تصميم Gemini Nano لتشغيله محليًا على معظم الأجهزة الحديثة، وهو الأنسب لحالات الاستخدام المتعلّقة باللغة مثل التلخيص أو إعادة الصياغة أو التصنيف.

وننوي أيضًا توفير واجهات برمجة تطبيقات استكشافية لتتمكّنوا من إجراء التجارب محليًا ومشاركة حالات استخدام إضافية.

على سبيل المثال، قد نوفر ما يلي:

  • واجهة برمجة تطبيقات الطلب: أرسِل مهمة عشوائية، معبرًا عنها بلغة طبيعية، إلى النموذج اللغوي الكبير المضمَّن (Gemini Nano في Chrome).
  • واجهة برمجة التطبيقات للضبط الدقيق (LoRA): يمكنك تحسين أداء النموذج اللغوي الكبير (LLM) المدمَج في مهمة من خلال ضبط أوزان النموذج باستخدام التوليف الدقيق للتكيف المنخفض.
يوضّح هذا المخطّط البياني كيف يمكن لموقعك الإلكتروني أو تطبيقك استخدام واجهات برمجة التطبيقات للمهام ومنصة الويب الاستكشافية للوصول إلى النماذج المضمَّنة في Chrome.

حالات استخدام الذكاء الاصطناعي المدمَج

في ما يلي بعض الطُرق التي نتوقّع أن يعود بها الذكاء الاصطناعي المدمَج بالفائدة عليك أنت والمستخدمين:

  • استهلاك المحتوى المحسَّن من خلال الذكاء الاصطناعي: بما في ذلك تلخيص المحتوى والترجمة والإجابة عن أسئلة حوله وتصنيفه وتصنيفه
  • إنشاء المحتوى استنادًا إلى الذكاء الاصطناعي: مثل المساعدة في الكتابة والتدقيق اللغوي وتصحيح القواعد النحوية وإعادة الصياغة

الخطوات التالية

يمكنك الانضمام إلى برنامج المعاينة المبكر لتجربة واجهات برمجة تطبيقات الذكاء الاصطناعي (AI) المدمَجة في المراحل الأولى.

وإلى حين توفّرها، يمكنك التعرّف على كيفية استخدام Gemini Pro على خوادم Google مع مواقعك الإلكترونية وتطبيقاتك على الويب في مقالة البدء السريع لحزمة تطوير البرامج (SDK) المستندة إلى JavaScript للذكاء الاصطناعي من Google.