مشاهدة محاضراتنا حول الذكاء الاصطناعي في مؤتمر I/O لعام 2025

Alexandra Klepper
Alexandra Klepper

تاريخ النشر: 22 مايو 2025

يغيّر الذكاء الاصطناعي الطريقة التي ينشئ بها مطوّرو الويب المواقع الإلكترونية وتطبيقات الويب. في مؤتمر Google I/O لعام 2025، شاركنا آخر الأخبار حول ما عملنا عليه خلال العام الماضي، وأوضحنا كيف يستفيد شركاؤنا من الذكاء الاصطناعي على الويب، وأعلنّا عن واجهات برمجة تطبيقات جديدة مدمجة للذكاء الاصطناعي.

هل فاتك الحدث؟ يسرّنا إعلامك بأنّه أصبح بإمكانك مشاهدة المحادثات عند الطلب.

ميزات عملية مضمَّنة في Chrome تستند إلى الذكاء الاصطناعي باستخدام Gemini Nano

مهمتنا الأساسية هي جعل Chrome والويب أكثر ذكاءً لجميع المطوّرين وجميع المستخدمين. في هذه الجلسة، يقدّم "توماس شتاينر" آخر الأخبار حول الذكاء الاصطناعي المضمّن، وحالات الاستخدام العملية، ونظرة على مستقبلنا.

يعمل الذكاء الاصطناعي المضمّن على تشغيل النماذج من جهة العميل في المتصفّح، ما يوفّر عدة مزايا:

  • خاصة: تظل بيانات المستخدمين الحساسة على الجهاز، ولا تحتاج إلى مغادرة المتصفّح مطلقًا.
  • بلا إنترنت: يمكن للتطبيقات الوصول إلى إمكانات الذكاء الاصطناعي، حتى بدون اتصال بالإنترنت.
  • الأداء العالي: بفضل تسريع الأجهزة، تقدّم واجهات برمجة التطبيقات هذه أداءً ممتازًا.

يمكنك الاطّلاع على عيّنات الرموز لكل واجهات برمجة التطبيقات المضمّنة المستندة إلى الذكاء الاصطناعي، والحصول على آخر الأخبار حول حالتها، والاطّلاع على الشركات التي تستخدم هذه التكنولوجيا.

واجهات برمجة التطبيقات المتعدّدة الوسائط

نعمل على تطوير واجهات برمجة تطبيقات جديدة متعددة الوسائط. يعني ذلك أنّه يمكنك سؤال Gemini Nano عن المحتوى المرئي الذي "يراه" أو المحتوى الصوتي الذي "يسمعه". على سبيل المثال، يمكنك الحصول على اقتراحات لنص بديل للصور التي تم تحميلها على منصة تدوين، ويمكن للمستخدمين تحسينها وتعديلها. أو يمكنك أن تطلب من Gemini Nano كتابة أوصاف أو نصوص لبرامج البودكاست.

الذكاء الاصطناعي المختلط

أحد التحديات التي يواجهها المطوّرون عند استخدام الذكاء الاصطناعي من جهة العميل هو أنّ بعض الأنظمة الأساسية والمتصفّحات لا تستوفي متطلبات الأجهزة لتشغيل نموذج على الجهاز. تعاونت Gemini مع Firebase لإنشاء حزمة تطوير البرامج (SDK) على الويب من Firebase، ما يتيح لك استخدام Gemini Nano على خادم في حال عدم توفّر عمليات التنفيذ من جهة العميل.

العمل معك

يسرّنا أنّنا عملنا مع العديد من المطوّرين على واجهات برمجة التطبيقات المضمّنة المستندة إلى الذكاء الاصطناعي. لن نتمكّن من تحقيق أهدافنا بدون دعمك.

لم ينتهِ عملك بعد. يُرجى مواصلة مشاركة ملاحظاتك وتجربة واجهات برمجة التطبيقات الجديدة المضمّنة، وسنواصل إجراء التحسينات. يمكنك حتى المساعدة في توحيد هذه الواجهات من خلال الانضمام إلى مجموعة Web Machine Learning Community Group التابعة لاتحاد شبكة الويب العالمية (W3C).

مستقبل "إضافات Chrome" مع "Gemini في متصفّحك"

تضاعف عدد الإضافات المستندة إلى الذكاء الاصطناعي خلال العامَين الماضيين. في الواقع، تستخدم% 10 من جميع الإضافات المثبَّتة من "سوق Chrome الإلكتروني" الذكاء الاصطناعي. في هذه الجلسة، يقدّم "سيباستيان بينز" أمثلة عملية توضّح سبب كون إضافات Chrome وGemini مزيجًا فعّالاً.

وتتراوح الأمثلة بين كيفية جعل المتصفّح أكثر فائدة من خلال استخراج البيانات ومعالجتها من المواقع الإلكترونية على الجهاز باستخدام واجهة برمجة التطبيقات الجديدة التي أطلقها Chrome.

عرض إمكانات جديدة متعددة الوسائط في واجهة برمجة التطبيقات الخاصة بطلبات Chrome في "إضافات Chrome" لتسهيل وصول المستخدمين إلى الصوت والصور

لإلقاء نظرة على مستقبل التصفّح من خلال شرح كيفية استخدام مشروع Mariner من Google DeepMind لإضافات Chrome وأحدث واجهات Gemini Cloud API لإنشاء وكيل متصفّح متكامل.

استكشِف إمكانية استخدام Gemini في السحابة الإلكترونية أو في المتصفّح ضمن إضافات Chrome لإنشاء تجارب تصفّح جديدة وجعل المتصفّح أكثر فائدة.

حالات استخدام الذكاء الاصطناعي على الويب واستراتيجياته في العالم الحقيقي

Yuriko Hirota
Yuriko Hirota
Swetha Gopalakrishnan
Swetha Gopalakrishnan

قدّمت "يوريكو هيروتا" و"سويثا غوبالاكريشنان" أمثلة واقعية لشركات تستخدم الذكاء الاصطناعي على الويب لتحسين أعمالها وتجربة المستخدم.وسواء كان الحلّ الذي تستخدمه يعتمد على نماذج من جهة العميل أو من جهة الخادم أو على حلّ مختلط، فإنّ الأهم هو الوظائف والميزات الجديدة الرائعة التي توفّرها للمستخدمين في الوقت الحالي.

أضافت منصة BILIBILI ميزة جديدة إلى أحداث البث المباشر للفيديوهات، وهي التعليقات على الشاشة، ما ساهم في زيادة تفاعل المستخدمين. وهي تعرض تعليقات المستخدمين في الوقت الفعلي على الفيديو، وتظهر خلف المتحدث. ولتحقيق ذلك، يستخدمون تجزئة الصور، وهو مفهوم معروف في مجال تعلُّم الآلة. ونتيجةً لذلك، زادت مدة الجلسة بنسبة %30. Tokopedia قلّلت من المشاكل في عملية التحقّق من هوية البائعين باستخدام نموذج للتعرّف على الوجه، وذلك لتقييم جودة الصور التي يتم تحميلها. نتيجةً لذلك، تمكّنوا من خفض الموافقات اليدوية بنسبة %70 تقريبًا.

‫Vision Nanny هي منصة على الويب مخصّصة للأطفال الذين يعانون من ضعف البصر الدماغي (CVI)، وتوفّر أنشطة لتحفيز البصر مستنِدة إلى الذكاء الاصطناعي. تستخدم هذه التطبيقات مكتبات متعددة من MediaPipe، بما في ذلك نموذج رصد معالم اليد الذي يحدّد نقاطًا رئيسية في اليدين ضمن صورة أو فيديو أو في الوقت الفعلي. أظهرت تجربة شملت 50 طفلاً أنّ تطبيق Vision Nanny قدّم ردودًا أسرع 5 مرات من أنشطة التحفيز البصري اليدوية. أفاد المعالجون النفسيون بأنّهم وفّروا ثلاث ساعات في المتوسط لكل جلسة من خلال إزالة عملية الإعداد اليدوي.

يتضمّن Google Meet العديد من الميزات المستنِدة إلى الذكاء الاصطناعي، بدءًا من تحسين الإضاءة وصولاً إلى تقليل التشويش في الفيديوهات. ويتمثل التحدي الأكبر في أنّ هذه الميزات يجب أن تعمل في الوقت الفعلي. هنا يأتي دور WebAssembly (Wasm)، للاستفادة من كامل إمكانات وحدة المعالجة المركزية في الكمبيوتر وإتاحة معالجة الفيديو في الوقت الفعلي.

هذه مجرد أمثلة قليلة من العالم الحقيقي على استخدام الذكاء الاصطناعي على الويب. جرّبت عدة شركات أخرى واجهات برمجة التطبيقات المضمّنة للذكاء الاصطناعي، وشارك بعضها أعماله في دراسات حالة.

وكلاء الذكاء الاصطناعي على الويب من جهة العميل لإنشاء تجارب مستخدم أكثر ذكاءً في المستقبل

تحدّث جايسون مايز عن مستقبل الإنترنت، أي برامج الذكاء الاصطناعي الوكيلة على الويب. سيشهد الويب مستقبلًا قائمًا على الوكلاء، إذ ستتوفّر إمكانات الذكاء الاصطناعي مباشرةً في المتصفّح لتنفيذ مهام مفيدة نيابةً عنك، وذلك بما يتجاوز إمكانات النماذج اللغوية الكبيرة (LLM).

من خلال اتّباع نهج من جهة العميل، يمكن تعزيز الخصوصية وتقليل وقت الاستجابة وتحقيق وفورات كبيرة محتملة في التكاليف. تتيح لك البرامج الآلية ترقية موقعك الإلكتروني الحالي لتنفيذ المهام بشكل مستقل نيابةً عن المستخدم، وذلك من خلال اختيار الأدوات المتاحة واستخدامها بشكل ديناميكي، وربما بشكل متكرر، ما يسمح للبرنامج الآلي بإكمال المهام التي قد تكون معقّدة أو تتضمّن عدة خطوات.

يمكن لموظّفي الدعم إجراء ما يلي:

  • التخطيط وتقسيم المهام الفرعية: معالجة المشاكل الأكثر تعقيدًا من خلال التخطيط المتعدّد الخطوات لتقسيم المهمة إلى خطوات منطقية لإكمالها
  • اختيار أفضل الأدوات، سواء كانت دوال أو استخدام واجهة برمجة تطبيقات أو الوصول إلى مخزن بيانات للاستفادة من المعرفة الأساسية لنموذج اللغة المحسّن، ثم تنفيذ إجراءات في العالم الخارجي
  • الاحتفاظ بالذاكرة المستندة إلى السياق، استنادًا إلى النتائج السابقة من الوكيل أو الأدوات الخارجية تعمل الذاكرة القصيرة المدى كذاكرة مؤقتة بنظام الوارد أولاً الصادر أولاً لسجلّ السياق، وذلك بما يصل إلى حجم نافذة السياق للنموذج، في حين أنّ الذاكرة الطويلة المدى تتيح استخدام قاعدة بيانات متجهة لتخزين المعلومات واسترجاعها عند الحاجة من جلسات المحادثات السابقة أو مصادر البيانات الأخرى بالكامل.

تم تصميم وكلاء الذكاء الاصطناعي على الويب ليتكاملوا مع تقنيات الويب الحالية في JavaScript. في النهاية، من المهم أن نواصل تسريع أجهزتنا لتشغيل النماذج في المتصفح على أفضل وجه. نتطلّع إلى المستقبل، حيث ستؤدي تكنولوجيات مثل WebNN دورًا رئيسيًا في تحسين تنفيذ النماذج على مستوى وحدات المعالجة المركزية (CPU) ووحدات معالجة الرسومات (GPU) ووحدات المعالجة العصبية (NPU). ومع الاتجاه نحو استخدام نماذج لغوية كبيرة أصغر حجمًا واستمرار التقدّم في هذا المجال، ستصبح هذه النماذج أكثر فعالية في المستقبل.

ننصحك باستخدام نهج مختلط يجمع بين المعالجة على الجهاز وعمليات الربط الاستراتيجية بالسحابة الإلكترونية، ما يتيح لك إنشاء تجارب ذكية وسريعة الاستجابة ومخصّصة للمستخدمين في المتصفّح الآن. في المستقبل القريب، من المفترض أن يؤتي استثمارك في نهج الذكاء الاصطناعي على الويب ثماره مع ازدياد قدرة الأجهزة على تشغيل نماذج اللغات الكبيرة.

ملخّص لأبرز أحداث مؤتمر Google I/O لعام 2025

لقد نشرنا جميع المحادثات التي أُجريت في مؤتمر Google I/O 2025، مع قائمة تشغيل مخصّصة لمطوّري الويب. يمكنك مشاهدة المزيد على io.google/2025.