تاريخ النشر: 14 مايو 2024
عندما ننشئ ميزات باستخدام نماذج الذكاء الاصطناعي (AI) على الويب، نعتمد غالبًا على البيانات من جهة الخادم. حلول للنماذج الأكبر. ينطبق ذلك بشكل خاص على الذكاء الاصطناعي التوليدي حتى أصغر النماذج تكون أكبر بألف مرة من متوسط حجم صفحة الويب. وينطبق ذلك أيضًا على حالات استخدام الذكاء الاصطناعي الأخرى، حيث يمكن أن تتراوح النماذج بين 10 و100 ميغابايت.
وبما أنّ نماذج الإعلانات هذه لا تتم مشاركتها على جميع المواقع الإلكترونية، على كل موقع إلكتروني تنزيلها عند تحميل الصفحة. هذا الحلّ غير عملي بالنسبة إلى المطوّرين والمستخدمين.
على الرغم من أنّ الذكاء الاصطناعي من جهة الخادم هو خيار رائع للطُرز الكبيرة، يعمل النظام على الجهاز والنموذج المختلط الأساليب التقليدية لها إيجابيات مقنعة. لجعل هذه نهجًا مجديًا، نحتاج إلى التطرق إلى حجم النموذج وتقديمه.
لهذا السبب، نعمل على تطوير واجهات برمجة تطبيقات لمنصّات الويب وميزات المتصفّح المصمّمة بهدف دمج نماذج الذكاء الاصطناعي، بما في ذلك النماذج اللغوية الكبيرة (LLM)، مباشرةً في المتصفّح. وتشمل هذه المعلومات ما يلي: Gemini Nano، هو النسخة الأكثر كفاءة من مجموعة Gemini من النماذج اللغوية الكبيرة، وهو مصمّم لتشغيله محليًا على معظم أجهزة الكمبيوتر المكتبية والمحمولة. باستخدام تكنولوجيات الذكاء الاصطناعي المدمجة، يمكن لموقعك الإلكتروني أو تطبيقك على الويب تنفيذ المهام المستندة إلى الذكاء الاصطناعي بدون الحاجة إلى نشر نماذج الذكاء الاصطناعي الخاصة به أو إدارتها.
تعرَّف على مزايا الذكاء الاصطناعي المضمّن وخطّة التنفيذ وكيفية الاستفادة من هذه التكنولوجيا.
معاينة المنتج قبل إطلاقه
نحتاج إلى ملاحظاتك لتصميم واجهات برمجة التطبيقات، والتأكّد من أنّها تستوفي حالات الاستخدام، وتوجيه مناقشاتنا مع مورّدي المتصفّحات الآخرين من أجل التوحيد.
يمكنك الانضمام إلى برنامج المعاينة المبكّرة لتقديم ملاحظاتك بشأن أفكار الذكاء الاصطناعي المضمّنة في مراحلها الأولى، واكتشاف فرص اختبار واجهات برمجة التطبيقاتقيد التطوير من خلال إنشاء النماذج على الجهاز.
الانضمام إلى مجموعة الإشعارات العلنية لمطوّري الذكاء الاصطناعي في Chrome لتلقّي إشعار عند توفُّر واجهات برمجة تطبيقات جديدة.
مزايا الذكاء الاصطناعي المضمّن لمطوّري الويب
من خلال الذكاء الاصطناعي المدمَج، يوفّر المتصفِّح ويديره للأساس ونماذج الخبراء.
مقارنةً بالذكاء الاصطناعي على الجهاز الذي يتم إجراؤه بنفسك، يوفّر الذكاء الاصطناعي المضمّن المزايا التالية:
- سهولة النشر: أثناء توزيع المتصفح للنماذج، يتطلب الأمر مراعاة قدرة الجهاز وإدارة تحديثات النموذج. وهذا يعني أنّك لست مسؤولاً عن تنزيل النماذج الكبيرة أو تعديلها على شبكة. لست بحاجة إلى حلّ مشاكل إخلاء مساحة التخزين وميزانية الذاكرة في وقت التشغيل وتكاليف العرض وغيرها من التحديات.
- الوصول إلى ميزة تسريع الأجهزة: تم تحسين بيئة تشغيل الذكاء الاصطناعي في المتصفّح للاستفادة إلى أقصى حد من الأجهزة المتاحة، سواء كانت وحدة معالجة رسومات أو وحدة معالجة عصبية أو وحدة معالجة مركزية. نتيجةً لذلك، يمكن لتطبيقك تحقيق أفضل أداء على كل جهاز.
مزايا التشغيل على الجهاز
من خلال نهج الذكاء الاصطناعي المضمّن، يصبح من السهل تنفيذ مهام الذكاء الاصطناعي على الجهاز، ما يقدّم بدوره المزايا التالية:
- المعالجة المحلية للبيانات الحسّاسة: يمكن للذكاء الاصطناعي على الجهاز فقط تحسين قصة الخصوصية. على سبيل المثال، إذا كنت تتعامل مع بيانات حسّاسة، يمكنك توفير ميزات الذكاء الاصطناعي للمستخدمين من خلال التشفير التام بين الأطراف.
- تجربة مستخدم سريعة: في بعض الحالات، يؤدي إلغاء الانتقال ذهابًا وإيابًا إلى يعني أنه يمكنك تقديم نتائج شبه فورية. يمكن أن يكون الذكاء الاصطناعي على الجهاز الفرق بين ميزة قابلة للتطبيق وتجربة مستخدم دون المستوى الأمثل.
- إمكانية الوصول بشكل أكبر إلى ميزات الذكاء الاصطناعي: يمكن لأجهزة المستخدمين تحمُّل بعض ملفوظة المعالجة مقابل إتاحة المزيد من الميزات. على سبيل المثال، إذا تقديم ميزات الذكاء الاصطناعي المدفوعة، ويمكنك معاينة هذه الميزات باستخدام الذكاء الاصطناعي على الجهاز فقط لكي يتمكّن العملاء المحتملون من رؤية مزايا منتجك، بدون تكلفة إضافية عليك. يمكن أن يساعدك هذا النهج المختلط أيضًا في إدارة تكاليف الاستنتاج، خاصةً في تدفقات المستخدِمين المستخدَمة بشكل متكرّر.
- استخدام الذكاء الاصطناعي بلا إنترنت: يمكن للمستخدمين الوصول إلى ميزات الذكاء الاصطناعي حتى في حال عدم توفّر اتصال بالإنترنت. وهذا يعني أنّه يمكن لمواقعك الإلكترونية وتطبيقات الويب العمل على النحو المتوقّع بلا إنترنت أو باستخدام اتصال متقطّع بالإنترنت.
الذكاء الاصطناعي المختلط: على الجهاز ومن جهة الخادم
يمكن للذكاء الاصطناعي على الجهاز فقط التعامل مع مجموعة كبيرة من حالات الاستخدام، إلا أنّ هناك بعض الحالات التي تتطلب دعمًا من جهة الخادم.
فعلى سبيل المثال، قد تحتاج إلى استخدام نماذج أكبر أو دعم مجموعة أكبر من الأنظمة الأساسية والأجهزة.
يمكنك استخدام مناهج مختلطة، استنادًا إلى ما يلي:
- التعقيد: من الأسهل إتاحة حالات الاستخدام المحدّدة والسهلة باستخدام الذكاء الاصطناعي على الجهاز. وبالنسبة إلى حالات الاستخدام المعقّدة، ننصحك بالتنفيذ من جهة الخادم.
- القدرة على التكيف: يتم استخدام ميزة "المعالجة على الخادم" تلقائيًا، ويتم استخدام ميزة "المعالجة على الجهاز" عندما يكون الجهاز غير متصل بالإنترنت أو عندما يكون الاتصال غير ثابت.
- الاستبدال السلس: سيستغرق استخدام المتصفّحات المزوّدة بتكنولوجيات الذكاء الاصطناعي المدمجة بعض الوقت، وقد لا تكون بعض الطُرز متاحة، وقد لا تستوفي الأجهزة القديمة أو الأقلّ كفاءة متطلبات الأجهزة لتشغيل جميع الطُرز على النحو الأمثل. العرض الترويجي الذكاء الاصطناعي من جهة الخادم لهؤلاء المستخدمين
بالنسبة إلى نماذج Gemini، يمكنك استخدام ميزة الدمج مع الخلفية (باستخدام Python و انتقال، Node.js أو REST) أو التنفيذ في إلى تطبيق الويب لديك مع حزمة SDK الخاصة بعميل "تكنولوجيات الذكاء الاصطناعي من Google" على الويب
بنية المتصفح وواجهات برمجة التطبيقات
لدعم الذكاء الاصطناعي المدمَج في Chrome، أنشأنا بنية أساسية تتيح الوصول إلى البيانات الأساسية ونماذج متخصّصة للتنفيذ على الجهاز فقط هذه البنية الأساسية مستخدمة حاليًا تعزيز ميزات المتصفح المبتكرة، مثل مساعدة في الكتابة، وسنشغّل قريبًا واجهات برمجة التطبيقات للذكاء الاصطناعي على الجهاز فقط.
يمكنك الوصول إلى إمكانات الذكاء الاصطناعي المضمّنة في المقام الأول من خلال واجهات برمجة التطبيقات المخصّصة للمهام، مثل واجهة برمجة تطبيقات الترجمة أو واجهة برمجة تطبيقات التلخيص. تم تصميم واجهات برمجة تطبيقات "مهام Google" لإجراء الاستنتاجات استنادًا إلى أفضل نموذج لتحديد المهام.
في Chrome، تم تصميم واجهات برمجة التطبيقات هذه لإجراء الاستنتاجات باستخدام Gemini Nano من خلال التحسين الدقيق أو نموذج الخبير. تم تصميم Gemini Nano للتشغيل على معظم الأجهزة الحديثة، وهو الأنسب لحالات الاستخدام المتعلّقة باللغة، مثل التلخيص أو إعادة الصياغة أو التصنيف.
وننوي أيضًا توفير واجهات برمجة تطبيقات استكشافية، حتى تتمكّن من إجراء تجارب على الجهاز فقط ومشاركة حالات استخدام إضافية.
على سبيل المثال، قد نقدّم ما يلي:
- Prompt API: أرسِل مهمة عشوائية مُعرَفة بلغة طبيعية إلى النموذج اللغوي الكبير المدمج (Gemini Nano في Chrome).
- واجهة برمجة التطبيقات لتحسين الأداء (LoRA): يمكنك تحسين أداء نموذج اللغة الضخمة المضمّن في مهمة معيّنة من خلال تعديل أوزان النموذج باستخدام تحسين التكيّف منخفضة الترتيب.
حالات استخدام الذكاء الاصطناعي المدمج
في ما يلي بعض الطرق التي يمكن أن تستفيد بها أنت والمستخدمين في مؤسستك من الذكاء الاصطناعي المدمَج:
- استهلاك المحتوى المحسّن عبر الذكاء الاصطناعي: بما في ذلك تلخيص المحتوى والترجمة والإجابة عن أسئلة حول بعض المحتوى والتصنيف والصفة.
- إنشاء المحتوى المستند إلى الذكاء الاصطناعي: مثل ميزة المساعدة في الكتابة والتدقيق اللغوي وتصحيح الأخطاء النحوية وإعادة الصياغة.
الخطوات التالية
يمكنك الانضمام إلى برنامج المعاينة المبكر لمحاولة استخدام واجهات برمجة تطبيقات الذكاء الاصطناعي المدمجة في مراحلها الأولى.
في هذه الأثناء، يمكنك التعرّف على كيفية استخدام Gemini Pro على خوادم Google من خلال مواقعك الإلكترونية وتطبيقات الويب في البدء السريع لحزمة تطوير البرامج (SDK) الخاصة بتكنولوجيات الذكاء الاصطناعي من Google