مشاهدة محاضراتنا حول الذكاء الاصطناعي في مؤتمر I/O لعام 2025

Alexandra Klepper
Alexandra Klepper

Published: May 22, 2025

يُحدث الذكاء الاصطناعي تحوّلاً في طريقة إنشاء مطوّري الويب للمواقع الإلكترونية وتطبيقات الويب. في مؤتمر Google I/O لعام 2025، شاركنا ما عملنا عليه خلال العام الماضي، وعرضنا كيف يستفيد شركاؤنا من الذكاء الاصطناعي على الويب، وأعلنّا عن واجهات برمجة تطبيقات جديدة للذكاء الاصطناعي المضمَّن.

هل فاتتك الفعالية؟ يسرّنا إعلامك بأنّه أصبح بإمكانك الآن مشاهدة المحادثات عند الطلب.

الذكاء الاصطناعي المضمَّن العملي باستخدام Gemini Nano في Chrome

مهمتنا الأساسية هي جعل Chrome والويب أكثر ذكاءً لجميع المطوّرين وجميع المستخدمين. في هذه المحادثة، يشارك Thomas Steiner آخر الأخبار عن الذكاء الاصطناعي المضمَّن وحالات الاستخدام العملية ونظرة على مستقبلنا.

تعمل نماذج الذكاء الاصطناعي المضمَّن على جانب العميل في المتصفّح، ما يمنحها عدة مزايا:

  • الخصوصية: تبقى بيانات المستخدم الحسّاسة على الجهاز، ولا تحتاج إلى مغادرة المتصفّح مطلقًا.
  • بدون إنترنت: يمكن للتطبيقات الوصول إلى إمكانات الذكاء الاصطناعي، حتى بدون الاتصال بالإنترنت.
  • الأداء العالي: بفضل تسريع الأجهزة، تقدّم واجهات برمجة التطبيقات هذه أداءً ممتازًا.

يمكنك الاطّلاع على نماذج الرموز البرمجية لكلّ واجهة من واجهات برمجة التطبيقات للذكاء الاصطناعي المضمَّن، والتعرّف على آخر الأخبار عن حالتها، والاطّلاع على الشركات التي تستخدم هذه التكنولوجيا.

واجهات برمجة التطبيقات المتعدّدة الوسائط

نعمل على تطوير واجهات برمجة تطبيقات جديدة تمامًا ومتعدّدة الوسائط. هذا يعني أنّه يمكنك أن تسأل النموذج عن ما "يراه" في المحتوى المرئي أو ما "يسمعه" في المحتوى الصوتي. على سبيل المثال، يمكنك الحصول على اقتراحات لنص بديل للصور التي تم تحميلها على منصة مدوّنة، ويمكن للمستخدمين تحسينها وتعديلها. أو يمكنك أن تطلب من Gemini Nano كتابة أوصاف أو نصوص صوتية لبرامج البودكاست.

الذكاء الاصطناعي المختلط

أحد التحديات التي يواجهها المطوّرون عند استخدام الذكاء الاصطناعي على جانب العميل هو أنّ بعض المنصات والمتصفّحات لا تستوفي متطلبات الأجهزة لتشغيل نموذج على الجهاز. تعاونت Gemini و Firebase لإنشاء حزمة Firebase Web SDK ، بحيث يمكنك الرجوع إلى Gemini Nano على خادم عندما لا تكون عمليات التنفيذ على جانب العميل متاحة.

التعاون معك

يسرّنا جدًا أنّنا عملنا مع العديد من المطوّرين على واجهات برمجة التطبيقات للذكاء الاصطناعي المضمَّن. ما كنّا لنحقق هذه الإنجازات بدون مساعدتك.

  • برنامج المعاينة المبكرة: انضم أكثر من 16,000 مطوّر إلى EPP، واختبروا واجهات برمجة التطبيقات الجديدة، واكتشفوا حالات استخدام جديدة، وقدّموا ملاحظاتهم لإنشاء ذكاء اصطناعي أفضل للويب.
  • الهاكاثون: استضفنا هاكاثونين، وأنشأتم مواقع إلكترونية وإضافات رائعة.

لم ينتهِ عملك بعد. يُرجى مواصلة مشاركة ملاحظاتك واختبار واجهات برمجة التطبيقات الجديدة للذكاء الاصطناعي المضمَّن، وسنواصل إجراء التحسينات. يمكنك حتى المساعدة في توحيد واجهات برمجة التطبيقات هذه من خلال الانضمام إلى مجموعة W3C Community Group الخاصة بتعلُّم الآلة على الويب.

مستقبل إضافات Chrome مع Gemini في متصفّحك

تضاعف عدد الإضافات المستندة إلى الذكاء الاصطناعي في العامَين الماضيين. في الواقع، تستخدم% 10 من جميع الإضافات التي تم تثبيتها من "سوق Chrome الإلكتروني" الذكاء الاصطناعي. في هذه المحادثة، يقدّم Sebastian Benz أمثلة عملية توضح سبب كون إضافات Chrome وGemini مزيجًا قويًا.

تتراوح الأمثلة بين كيفية جعل المتصفّح أكثر فائدةً من خلال استخراج البيانات ومعالجتها من المواقع الإلكترونية على جانب العميل باستخدام واجهة برمجة التطبيقات الجديدة للطلبات في Chrome.

إلى عرض إمكانات واجهة برمجة التطبيقات الجديدة للطلبات في Chrome في إضافات Chrome لجعل المحتوى الصوتي والمرئي أكثر سهولةً للمستخدمين.

إلى إلقاء نظرة على مستقبل التصفّح من خلال شرح كيفية استخدام مشروع Mariner من Google DeepMind لإضافات Chrome وأحدث واجهات برمجة تطبيقات Gemini Cloud لإنشاء وكيل متصفّح كامل.

يمكنك استكشاف إمكانات استخدام Gemini في السحابة الإلكترونية أو في المتصفّح في إضافات Chrome لإنشاء تجارب تصفّح جديدة وجعل المتصفّح أكثر فائدةً.

حالات استخدام الذكاء الاصطناعي على الويب واستراتيجياته في العالم الحقيقي

Yuriko Hirota
Yuriko Hirota
Swetha Gopalakrishnan
Swetha Gopalakrishnan

سلّطت Yuriko Hirota وSwetha Gopalakrishnan الضوء على أمثلة واقعية لشركات تستخدم الذكاء الاصطناعي على الويب لتحسين أعمالها وتجربة المستخدم.بغض النظر عمّا إذا كان الحلّ يستخدم نماذج على جانب العميل أو على جانب الخادم أو حلاً مختلطًا، فإنّ ما يهم هو الوظائف والميزات الجديدة الرائعة التي تتيحها للمستخدمين الآن.

أضافت BILIBILI ميزة جديدة إلى بث الفيديوهات المباشرة لجعلها أكثر تفاعلاً: التعليقات على الشاشة. تقدّم الشركة تعليقات المستخدمين في الوقت الفعلي في الفيديو، وتظهر خلف المتحدث. لتحقيق ذلك، تستخدم الشركة تجزئة الصور، وهو مفهوم مفهوم جيدًا في تعلُّم الآلة. نتيجةً لذلك، زادت مدة الجلسة بنسبة %30. قلّلت Tokopedia من الاحتكاك في عملية التحقق من هوية البائع باستخدام نموذج للكشف عن الوجه، وذلك لتقييم جودة الصور التي تم تحميلها. نتيجةً لذلك، قلّلت الشركة عمليات الموافقة اليدوية بنسبة %70 تقريبًا.

تقدّم Vision Nanny، وهي منصة ويب للأطفال الذين يعانون من ضعف البصر الدماغي، أنشطة لتحفيز البصر مستندة إلى الذكاء الاصطناعي. تستخدم المنصة عدة مكتبات MediaPipe، بما في ذلك نموذج الكشف عن معالم اليد، الذي يحدّد النقاط الرئيسية لليدَين في صورة أو فيديو أو في الوقت الفعلي. أظهرت تجربة تجريبية أجريناها على 50 طفلاً أنّ Vision Nanny قدّمت الردود أسرع بـ 5 مرّات من أنشطة تحفيز البصر اليدوية. أفاد المعالجون بأنّهم وفّروا ثلاث ساعات في المتوسط لكل جلسة من خلال إزالة الإعداد اليدوي.

يتضمّن Google Meet عدة ميزات مستندة إلى الذكاء الاصطناعي، بدءًا من تحسين الإضاءة إلى تقليل التشويش والفيديوهات غير الواضحة. التحدي الأكبر هو أنّ هذه الميزات يجب أن تعمل في الوقت الفعلي. هنا يأتي دور WebAssembly (Wasm)، للاستفادة من الإمكانات الكاملة لوحدة المعالجة المركزية في الكمبيوتر وتمكين معالجة الفيديوهات في الوقت الفعلي.

هذه مجرد أمثلة قليلة على استخدام الذكاء الاصطناعي على الويب. جرّبت عدة شركات أخرى واجهات برمجة التطبيقات للذكاء الاصطناعي المضمَّن، وشاركت بعضها أعمالها في دراسات حالة.

وكلاء الذكاء الاصطناعي على الويب على جانب العميل لإنشاء تجارب مستخدم أكثر ذكاءً في المستقبل

شرح Jason Mayes مستقبل الإنترنت: وكلاء الذكاء الاصطناعي على الويب. سيصبح الويب في المستقبل معتمِدًا على الوكلاء، ما يتيح إمكانات الذكاء الاصطناعي مباشرةً في المتصفّح، لتنفيذ أعمال مفيدة نيابةً عنك، بما يتجاوز إمكانات النماذج اللغوية الكبيرة.

من خلال استخدام الذكاء الاصطناعي على جانب العميل، يتم تعزيز الخصوصية وتقليل وقت الاستجابة وتحقيق وفورات كبيرة محتملة في التكاليف. تسمح لك الوكلاء بترقية موقعك الإلكتروني الحالي، لتنفيذ المهام بشكلٍ مستقل نيابةً عن المستخدم، واختيار الأدوات المتاحة واستخدامها بشكلٍ ديناميكي، ربما في حلقة تكرار، ما يسمح للوكيل بإكمال المهام التي قد تكون معقدة أو متعدّدة الخطوات.

يمكن للوكلاء تنفيذ ما يلي:

  • تخطيط المهام وتقسيمها إلى مهام فرعية، ومعالجة المشاكل الأكثر تعقيدًا من خلال التخطيط المتعدّد الخطوات لتقسيم المهمة إلى خطوات منطقية لإكمالها.
  • اختيار أفضل الأدوات، سواء كانت وظائف أو استخدام واجهة برمجة تطبيقات أو الوصول إلى مخزن البيانات لتعزيز المعرفة الأساسية للنموذج اللغوي، ثم تنفيذ الإجراءات في العالم الخارجي.
  • الاحتفاظ بالذاكرة المستندة إلى السياق، استنادًا إلى النتائج السابقة من الوكيل أو الأدوات الخارجية. تعمل الذاكرة قصيرة المدى مثل مخزن مؤقت FIFO لسجلّ السياق يصل إلى حجم نافذة السياق في النموذج، في مقابل الذاكرة طويلة المدى حيث يمكن استخدام قاعدة بيانات متجهة لتخزين المعلومات لاسترجاعها حسب الحاجة من جلسات المحادثة السابقة أو مصادر البيانات الأخرى بالكامل.

تم تصميم وكلاء الذكاء الاصطناعي على الويب لدمجهم في تكنولوجيات الويب الحالية في JavaScript. في النهاية، من المهم أن نواصل تسريع أجهزتنا لتشغيل النماذج على أفضل وجه في المتصفّح. بالنظر إلى المستقبل، ستؤدي تكنولوجيا مثل WebNN دورًا رئيسيًا في تحسين تنفيذ النماذج على وحدات المعالجة المركزية ووحدات معالجة الرسومات ووحدات المعالجة العصبية. مع الاتجاه نحو النماذج اللغوية الكبيرة الأصغر حجمًا والتقدّم المستمر، ستصبح هذه النماذج أكثر قوةً في المستقبل.

ننصحك باستخدام نهج مختلط، يجمع بين المعالجة على الجهاز وعمليات طلب السحابة الإلكترونية الاستراتيجية، حتى تتمكن من إنشاء تجارب مستخدم ذكية وسريعة الاستجابة ومخصّصة في المتصفّح الآن. قريبًا، من المفترض أن يحقق لك عائد الاستثمار في نهج الذكاء الاصطناعي على الويب أرباحًا مع زيادة قدرة الأجهزة على تشغيل النماذج اللغوية الكبيرة.

متابعة آخر الأخبار من مؤتمر Google I/O لعام 2025

لقد نشرنا جميع المحادثات لمؤتمر Google I/O لعام 2025، مع قائمة تشغيل مخصّصة لمطوّري الويب. يمكنك مشاهدة المزيد على io.google/2025.