الذكاء الاصطناعي المدمَج

Kenji Baheux
Kenji Baheux
Alexandra Klepper
Alexandra Klepper

تاريخ النشر: 14 أيار (مايو) 2024، تاريخ آخر تعديل: 13 تشرين الثاني (نوفمبر) 2024

عند إنشاء ميزات باستخدام نماذج الذكاء الاصطناعي على الويب، غالبًا ما نعتمد على حلول تتعلّق بالخادم للنماذج الأكبر حجمًا. وينطبق ذلك بشكل خاص على الذكاء الاصطناعي التوليدي، حيث يكون حتى أصغر النماذج أكبر بألف مرة تقريبًا من متوسط حجم صفحة الويب. وينطبق ذلك أيضًا على حالات استخدام الذكاء الاصطناعي الأخرى، حيث يمكن أن تتراوح أحجام النماذج بين 10 و100 ميغابايت. وبما أنّ نماذج الإعلانات هذه لا تتم مشاركتها على جميع المواقع الإلكترونية، على كل موقع إلكتروني تنزيلها عند تحميل الصفحة. وهذا الإجراء غير عملي بالنسبة إلى المطوّرين والمستخدمين.

نعمل على تطوير واجهات برمجة تطبيقات لمنصّات الويب وميزات المتصفّح المصمّمة بهدف دمج نماذج الذكاء الاصطناعي، بما في ذلك النماذج اللغوية الكبيرة (LLM)، مباشرةً في المتصفّح. ويشمل ذلك Gemini Nano، وهو الإصدار الأكثر فعالية من عائلة النماذج اللغوية الكبيرة Gemini، وهو مصمّم للتشغيل على الجهاز فقط على معظم أجهزة الكمبيوتر المكتبي والكمبيوتر المحمول الحديثة. باستخدام تكنولوجيات الذكاء الاصطناعي المدمجة، يمكن لموقعك الإلكتروني أو تطبيقك على الويب تنفيذ المهام المستندة إلى الذكاء الاصطناعي بدون الحاجة إلى نشر نماذج الذكاء الاصطناعي الخاصة به أو إدارتها.

تعرَّف على مزايا الذكاء الاصطناعي المضمّن وخطّة التنفيذ وكيفية الاستفادة من هذه التكنولوجيا.

الحصول على نسخة حصرية

نحتاج إلى ملاحظاتك لتصميم واجهات برمجة التطبيقات والتأكّد من أنّها تستوفي حالات الاستخدام التي تهمّك، و لإعلامنا بمناقشاتنا مع مورّدي المتصفّحات الآخرين بشأن عملية التوحيد.

انضم إلى برنامج المعاينة المبكّرة لتقديم ملاحظاتك بشأن أفكار الذكاء الاصطناعي المدمَج في مراحلها الأولى، واكتشاف فرص اختبار واجهات برمجة التطبيقاتقيد التطوير من خلال وضع النماذج الأولية على الجهاز.

يمكنك الانضمام إلى مجموعة الإعلانات العامة لمطوّري تطبيقات الذكاء الاصطناعي في Chrome لتلقّي إشعارات عند توفّر واجهات برمجة تطبيقات جديدة.

مزايا الذكاء الاصطناعي المضمّن لمطوّري الويب

باستخدام تكنولوجيات الذكاء الاصطناعي المضمّنة، يقدّم المتصفّح ويدير نماذج الأساس والنماذج المخصّصة للخبراء.

مقارنةً بإنشاء تقنيات الذكاء الاصطناعي من جهة العميل، يوفّر الذكاء الاصطناعي المضمّن الفوائد التالية:

  • سهولة النشر: أثناء توزيع المتصفّح للنماذج، يأخذ في الاعتبار إمكانات الجهاز ويدير التحديثات التي تطرأ على النموذج. وهذا يعني أنّك لست مسؤولاً عن تنزيل النماذج الكبيرة أو تعديلها على شبكة. لست بحاجة إلى حلّ المشاكل المتعلّقة بإخلاء مساحة التخزين وميزانية الذاكرة في وقت التشغيل وتكاليف العرض وغيرها من التحديات.
  • الوصول إلى ميزة تسريع الأجهزة: تم تحسين بيئة تشغيل الذكاء الاصطناعي في المتصفّح للاستفادة إلى أقصى حد من الأجهزة المتاحة، سواء كانت وحدة معالجة رسومات أو وحدة معالجة عصبية أو وحدة معالجة مركزية. نتيجةً لذلك، يمكن لتطبيقك تحقيق أفضل أداء على كل جهاز.

مزايا التشغيل من جهة العميل

باستخدام نهج الذكاء الاصطناعي المضمّن، يصبح من السهل تنفيذ مهام الذكاء الاصطناعي من جهة العميل، ما يقدّم بدوره المزايا التالية:

  • المعالجة المحلية للبيانات الحساسة: يمكن أن تحسِّن تكنولوجيات الذكاء الاصطناعي من جهة العميل ملفّك المتعلّق بالخصوصية. على سبيل المثال، إذا كنت تتعامل مع بيانات حسّاسة، يمكنك توفير ميزات الذكاء الاصطناعي للمستخدمين من خلال التشفير التام بين الأطراف.
  • تجربة سريعة للمستخدم: في بعض الحالات، يمكنك تقديم نتائج فورية تقريبًا من خلال عدم إجراء رحلة ذهاب وإياب إلى المعالج. يمكن أن يشكّل الذكاء الاصطناعي من جهة العميل اختلافًا بين ميزة قابلة للتطبيق وتجربة مستخدم غير مثالية.
  • إمكانية الوصول بشكل أكبر إلى الذكاء الاصطناعي: يمكن لأجهزة المستخدمين تحمل بعض ملفوظة المعالجة مقابل إتاحة المزيد من الميزات. على سبيل المثال، إذا كنت تقدّم ميزات ذكاء اصطناعي مدفوعة، يمكنك معاينة هذه الميزات باستخدام ميزات الذكاء الاصطناعي من جهة العميل ليتمكّن العملاء المحتملون من الاطّلاع على مزايا منتجك بدون أي تكلفة إضافية. يمكن أن يساعدك هذا النهج المختلط أيضًا في إدارة تكاليف الاستنتاج، خاصةً في تدفقات المستخدمين المستخدَمة بشكل متكرّر.
  • استخدام الذكاء الاصطناعي بلا إنترنت: يمكن للمستخدمين الوصول إلى ميزات الذكاء الاصطناعي حتى في حال عدم توفّر اتصال بالإنترنت. وهذا يعني أنّه يمكن لمواقعك الإلكترونية وتطبيقات الويب العمل على النحو المتوقّع بلا إنترنت أو باستخدام اتصال متقطّع بالإنترنت.

الذكاء الاصطناعي المختلط: من جهة العميل ومن جهة الخادم

على الرغم من أنّ الذكاء الاصطناعي من جهة العميل يمكنه التعامل مع مجموعة كبيرة من حالات الاستخدام، هناك حالات معيّنة تتطلّب الدعم من جهة الخادم.

يُعدّ الذكاء الاصطناعي من جهة الخادم خيارًا رائعًا للنماذج الكبيرة، ويمكنه إتاحة استخدام مجموعة أوسع من المنصات والأجهزة.

يمكنك اتّباع نهج مختلط استنادًا إلى:

  • مستوى التعقيد: من الأسهل إتاحة حالات الاستخدام المحدّدة والسهلة باستخدام الذكاء الاصطناعي على الجهاز. بالنسبة إلى حالات الاستخدام المعقّدة، ننصحك بتنفيذ الإجراء من جهة الخادم.
  • القدرة على التكيف: يتم استخدام ميزة "المعالجة على الخادم" تلقائيًا، ويتم استخدام ميزة "المعالجة على الجهاز" عندما يكون الجهاز غير متصل بالإنترنت أو عندما يكون الاتصال غير ثابت.
  • الاستبدال السلس: سيستغرق استخدام المتصفّحات المزوّدة بتكنولوجيا الذكاء الاصطناعي المدمجة بعض الوقت، وقد لا تكون بعض الطُرز متاحة، وقد لا تستوفي الأجهزة القديمة أو الأقلّ كفاءة متطلبات الأجهزة لتشغيل جميع الطُرز على النحو الأمثل. أن توفّر الذكاء الاصطناعي من جهة الخادم لهؤلاء المستخدمين

بالنسبة إلى نماذج Gemini، يمكنك استخدام الدمج مع الخلفية (باستخدام Python أو Go أو Node.js أو REST) أو التنفيذ في تطبيق الويب باستخدام حزمة تطوير البرامج (SDK) الجديدة لخدمة Google AI للويب.

بنية المتصفّح وواجهات برمجة التطبيقات

لدعم ميزات الذكاء الاصطناعي المدمجة في Chrome، أنشأنا بنية أساسية للوصول إلى نماذج أساسية ونماذج الخبراء لتنفيذها على الجهاز. توفّر هذه البنية الأساسية حاليًا ميزات مبتكرة للمتصفّح، مثل أحتاج إلى المساعدة في الكتابة.

يمكنك الوصول إلى إمكانات الذكاء الاصطناعي المدمجة بشكل أساسي باستخدام واجهات برمجة التطبيقات المخصّصة للمهام، مثل Translator API أو Summarizer API. تم تصميم واجهات برمجة التطبيقات Task API لإجراء الاستنتاج باستخدام أفضل نموذج للمهمة.

في Chrome، تم تصميم واجهات برمجة التطبيقات هذه لإجراء الاستنتاجات باستخدام Gemini Nano من خلال التحسين الدقيق أو نموذج الخبير. تم تصميم Gemini Nano للتشغيل على معظم الأجهزة الحديثة، وهو الأنسب لحالات الاستخدام المتعلقة باللغة، مثل التلخيص أو إعادة الصياغة أو التصنيف.

نوفّر أيضًا واجهات برمجة تطبيقات استكشافية، مثل Prompt API، لكي تتمكّن من إجراء تجارب على الجهاز ومشاركة حالات استخدام إضافية.

في المستقبل، قد نقدّم واجهة برمجة تطبيقات استكشافية لبروتوكول LoRA، وذلك لتحسين أداء النموذج المضمّن من خلال تعديل مَعلمات النموذج.

يوضِّح هذا المخطّط البياني كيف يمكن لموقعك الإلكتروني أو تطبيقك استخدام واجهات برمجة التطبيقات المخصّصة للمهام والتطبيقات الاستكشافية المستندة إلى الويب للوصول إلى النماذج المضمّنة في Chrome.

حالات استخدام الذكاء الاصطناعي المدمج

في ما يلي بعض الطرق التي يمكن أن تستفيد منها أنت والمستخدمون من ميزة الذكاء الاصطناعي المدمجة:

  • استهلاك المحتوى المحسّن بالذكاء الاصطناعي: بما في ذلك التلخيص، والترجمة، والتصنيف، والتوصيف، وتوفير المعرفة
  • إنشاء المحتوى المستنِد إلى الذكاء الاصطناعي: مثل مساعدة الكتابة والتدقيق اللغوي وتصحيح الأخطاء النحوية وإعادة الصياغة

الخطوات التالية

تتوفّر العديد من واجهات برمجة تطبيقات الذكاء الاصطناعي المضمّنة لاختبارها في مراحل التجربة والتقييم. تتوفّر واجهات برمجة التطبيقات الاستكشافية وغيرها من واجهات برمجة التطبيقات في المرحلة الأولى ل المشاركين في برنامج المعاينة المبكّرة.

يمكنك التعرّف على كيفية استخدام Gemini Pro على خوادم Google مع مواقعك الإلكترونية وتطبيقات الويب في الدليل السريع لاستخدام حزمة Google AI JavaScript SDK.