Regarder nos conférences sur l'IA lors de la conférence I/O 2025

Alexandra Klepper
Alexandra Klepper

Publié le : 22 mai 2025

L'IA transforme la façon dont les développeurs Web créent des sites Web et des applications Web. Lors de Google I/O 2025, nous avons présenté nos travaux de l'année écoulée, montré comment nos partenaires utilisent l'IA sur le Web et annoncé de nouvelles API d'IA intégrées.

Vous avez manqué l'événement ? Bonne nouvelle : vous pouvez désormais regarder les conférences à la demande.

IA pratique intégrée avec Gemini Nano dans Chrome

Notre mission principale est de rendre Chrome et le Web plus intelligents pour tous les développeurs et tous les utilisateurs. Dans cette présentation, Thomas Steiner partage des informations sur l'IA intégrée, des cas d'utilisation pratiques et un aperçu de l'avenir.

L'IA intégrée exécute des modèles côté client dans le navigateur, ce qui présente plusieurs avantages :

  • Privé : les données utilisateur sensibles restent sur l'appareil et n'ont jamais besoin de quitter le navigateur.
  • Hors connexion : les applications peuvent accéder aux fonctionnalités d'IA, même sans connexion Internet.
  • Performantes : grâce à l'accélération matérielle, ces API offrent d'excellentes performances.

Consultez des exemples de code pour chacune des API d'IA intégrées, obtenez des informations sur leur état et découvrez les entreprises qui mettent en œuvre cette technologie.

API multimodales

Nous travaillons sur de nouvelles API multimodales. Cela signifie que vous pouvez demander à Gemini Nano ce qu'il "voit" dans un contenu visuel ou ce qu'il "entend" dans un contenu audio. Par exemple, obtenez des suggestions de texte alternatif pour les images importées sur une plate-forme de blog, que les utilisateurs peuvent affiner et modifier. Vous pouvez également demander à Gemini Nano de rédiger des descriptions ou des transcriptions de podcasts.

IA hybride

L'un des défis auxquels les développeurs sont confrontés avec l'IA côté client est que toutes les plates-formes et tous les navigateurs ne répondent pas aux exigences matérielles pour exécuter un modèle sur l'appareil. Gemini et Firebase se sont associés pour créer le SDK Web Firebase. Ainsi, lorsque les implémentations côté client ne sont pas disponibles, vous pouvez revenir à Gemini Nano sur un serveur.

Travailler avec vous

Nous sommes ravis d'avoir collaboré avec autant de développeurs sur les API d'IA intégrées. Nous ne pourrions pas y arriver sans vous.

  • Programme d'accès anticipé : plus de 16 000 développeurs ont rejoint le PAA, testant de nouvelles API, découvrant de nouveaux cas d'utilisation et fournissant des commentaires pour créer une meilleure IA pour le Web.
  • Hackathons : nous avons organisé deux hackathons, et vous avez créé des sites Web et des extensions incroyables.

Votre travail n'est pas terminé. Continuez à nous faire part de vos commentaires et à tester les nouvelles API intégrées. Nous continuerons à les améliorer. Vous pouvez même contribuer à la standardisation de ces API en rejoignant le Web Machine Learning Community Group du W3C.

L'avenir des extensions Chrome avec Gemini dans votre navigateur

Le nombre d'extensions optimisées par l'IA a doublé au cours des deux dernières années. En effet, 10 % de toutes les extensions installées à partir du Chrome Web Store utilisent l'IA. Dans cette conférence, Sebastian Benz donne des exemples pratiques pour illustrer pourquoi les extensions Chrome et Gemini forment une combinaison si efficace.

Par exemple, vous pouvez rendre le navigateur plus utile en extrayant et en traitant les données des sites Web sur le client à l'aide de la nouvelle API d'invite de Chrome.

Démonstration du potentiel des nouvelles fonctionnalités multimodales de l'API de requête de Chrome dans les extensions Chrome pour rendre l'audio et les images plus accessibles aux utilisateurs.

Découvrez l'avenir de la navigation en expliquant comment le projet Mariner de Google DeepMind utilise les extensions Chrome et les dernières API Gemini Cloud pour créer un agent de navigateur complet.

Découvrez le potentiel de Gemini dans le cloud ou dans le navigateur dans les extensions Chrome pour créer de nouvelles expériences de navigation et rendre le navigateur plus utile.

Cas d'utilisation et stratégies de l'IA Web dans le monde réel

Yuriko Hirota
Yuriko Hirota
Swetha Gopalakrishnan
Swetha Gopalakrishnan

Yuriko Hirota et Swetha Gopalakrishnan ont présenté des exemples concrets d'entreprises qui utilisent l'IA sur le Web pour améliorer leur activité et l'expérience utilisateur.Que leur solution utilise des modèles côté client, côté serveur ou une solution hybride, ce qui compte, ce sont les nouvelles fonctions et fonctionnalités intéressantes que vous mettez à la disposition de vos utilisateurs dès maintenant.

BILIBILI a rendu ses diffusions vidéo plus attrayantes grâce à une nouvelle fonctionnalité : les commentaires bullet. Ils affichent les commentaires des utilisateurs en temps réel dans la vidéo, derrière l'orateur. Pour ce faire, ils utilisent la segmentation d'image, un concept de machine learning bien connu. Résultat : la durée des sessions a augmenté de 30 % ! Tokopedia a réduit les frictions dans son processus de validation des vendeurs à l'aide d'un modèle de détection des visages, afin d'évaluer la qualité des photos importées. Résultat : les approbations manuelles ont diminué de près de 70 %.

Vision Nanny est une plate-forme Web destinée aux enfants atteints de déficience visuelle corticale (DVC). Elle propose des activités de stimulation visuelle optimisées par l'IA. Ils utilisent plusieurs bibliothèques MediaPipe, y compris le modèle de détection des points de repère de la main, qui localise les points clés des mains dans une image, une vidéo ou en temps réel. Un pilote mené auprès de 50 enfants a démontré que Vision Nanny fournissait des réponses cinq fois plus rapidement que les activités de stimulation visuelle manuelle. Les thérapeutes ont déclaré gagner en moyenne trois heures par séance en supprimant la configuration manuelle.

Google Meet propose plusieurs fonctionnalités optimisées par l'IA, qui permettent d'améliorer l'éclairage, de réduire le flou et d'améliorer la qualité des vidéos. Le plus grand défi est que ces fonctionnalités doivent fonctionner en temps réel. C'est là qu'intervient WebAssembly (Wasm), qui permet d'exploiter toute la puissance du processeur d'un ordinateur et de traiter les vidéos en temps réel.

Ce ne sont que quelques exemples concrets d'IA sur le Web. Plusieurs autres entreprises ont testé les API d'IA intégrées, dont certaines ont partagé leurs travaux dans des études de cas.

Agents d'IA Web côté client pour créer des expériences utilisateur plus intelligentes à l'avenir

Jason Mayes a présenté l'avenir d'Internet : les agents Web d'IA. L'avenir du Web est agentique. Il apportera des fonctionnalités d'IA directement au navigateur, pour effectuer des tâches utiles en votre nom, au-delà des capacités des grands modèles de langage (LLM).

Avec une approche côté client, la confidentialité est renforcée, la latence est réduite et des économies importantes peuvent être réalisées. Les agents vous permettent de mettre à niveau votre site Web existant, d'effectuer des tâches de manière autonome pour un utilisateur, de sélectionner et d'utiliser dynamiquement des outils exposés (potentiellement en boucle), ce qui permet à l'agent d'accomplir des tâches potentiellement complexes ou en plusieurs étapes.

Les agents peuvent :

  • Planifier et diviser les sous-tâches : gérer les problèmes plus complexes grâce à une planification en plusieurs étapes pour décomposer la tâche en étapes logiques à suivre.
  • Sélectionnez les meilleurs outils, qu'il s'agisse de fonctions, de l'utilisation d'API ou de l'accès à un data store pour augmenter les connaissances de base du modèle linguistique, puis effectuez des actions dans le monde extérieur.
  • Conserver la mémoire basée sur le contexte, en fonction des sorties précédentes de l'agent ou des outils externes. La mémoire à court terme agit comme un tampon FIFO de l'historique du contexte jusqu'à la taille de la fenêtre de contexte du modèle, contrairement à la mémoire à long terme où une base de données vectorielle peut être utilisée pour stocker des informations à rappeler au besoin à partir de sessions de conversation précédentes ou d'autres sources de données.

Les agents d'IA Web sont conçus pour s'intégrer aux technologies Web existantes en JavaScript. Enfin, il est important que nous continuions à accélérer notre matériel pour exécuter au mieux les modèles dans le navigateur. À l'avenir, des technologies comme WebNN joueront un rôle clé dans l'optimisation de l'exécution des modèles sur les CPU, GPU et NPU. Avec la tendance aux LLM plus petits et les progrès continus, cette technologie ne fera que gagner en puissance à l'avenir.

Envisagez d'utiliser une approche hybride, en combinant le traitement sur l'appareil avec des appels cloud stratégiques. Vous pourrez ainsi créer des expériences utilisateur intelligentes, réactives et personnalisées dans le navigateur dès maintenant. Bientôt, votre retour sur investissement dans l'approche Web AI devrait porter ses fruits à mesure que les appareils deviendront plus performants pour exécuter les LLM.

Revivez Google I/O 2025

Nous avons publié toutes les conférences de Google I/O 2025, avec une playlist dédiée aux développeurs Web. Pour en savoir plus, rendez-vous sur io.google/2025.