WebMCP

Alexandra Klepper
Alexandra Klepper

Publié le 18 mai 2026

WebMCP est une norme Web proposée pour vous aider à créer et à exposer des outils structurés pour les agents IA . WebMCP fournit du code JavaScript et annote les éléments de formulaire HTML afin que les agents sachent exactement comment interagir avec les fonctionnalités de la page pour améliorer l'expérience utilisateur. Cela peut améliorer considérablement les performances et la fiabilité de l'activation des agents.

Les agents IA sont une technologie plus récente. Ils peuvent aider les utilisateurs humains à effectuer des tâches très complexes et techniques. WebMCP offre une plus grande précision pour l'exécution des tâches agentiques et peut être ajouté en tant qu'amélioration progressive.

Pourquoi utiliser WebMCP ?

WebMCP peut vous aider à combler le fossé entre les applications Web et les agents, en améliorant l'efficacité, la fiabilité et l'exécution des tâches grâce à des règles d'interaction. Au lieu qu'un agent examine l'élément, tel qu'un bouton ou un champ, pour comprendre son objectif, le site Web déclare l'objectif de l'élément afin qu'il soit utilisé correctement.

Cette méthode est plus fiable que l'activation, qui peut comporter de nombreuses étapes et laisser chaque étape à l'interprétation de l'agent.

Les sites Web peuvent partager un objectif explicite, tel que la recherche ou l'achat, en définissant un outil. Ces outils s'exécutent de manière visible sur votre page Web, ce qui permet aux utilisateurs de s'assurer que les tâches sont effectuées comme prévu. Cela préserve également votre marque et vos choix de conception centrés sur l'humain.

WebMCP est compatible avec les éléments suivants :

  • Découverte : méthode standard permettant aux pages d'enregistrer des outils auprès des agents, tels que checkout ou filter_results.
  • Schémas JSON : définitions explicites des entrées et des sorties attendues, afin de réduire les hallucinations ou les malentendus.
  • État : compréhension partagée du contexte actuel de la page, afin que l'agent sache quelles ressources sont disponibles pour agir en temps réel.

Notre objectif est de créer des API que n'importe quel navigateur doté de capacités agentiques peut implémenter et dont il peut bénéficier, afin que vos utilisateurs puissent effectuer plus facilement des tâches. Vous pouvez suivre ce processus sur GitHub.

Cas d'utilisation

Vous pouvez utiliser WebMCP sur le Web de nombreuses façons. Exemple :

  • Aider vos clients à obtenir de l'assistance. Si vous fournissez un logiciel à vos clients, vous pouvez avoir un flux d'assistance complexe pour répondre à de nombreuses questions différentes. Vous pouvez utiliser WebMCP pour aider un agent à accéder plus rapidement au bon formulaire et à remplir les champs avec les informations fournies par l'utilisateur.
  • Améliorer la réservation de voyages. Aidez les agents à réserver des voyages complexes, multi-destinations et pour plusieurs passagers en moins d'étapes.

Certaines actions peuvent être sensibles, comme effectuer un achat. Vous pouvez inclure une commande pour demander à l'utilisateur d'interagir avec une boîte de dialogue de confirmation.

Concrètement, vos outils peuvent effectuer les tâches suivantes :

  • Remplir des formulaires structurés : créez un outil submit_application pour aider les agents à mapper correctement les données collectées lors de la conversation avec l'utilisateur dans les champs du formulaire. Par exemple, vous pouvez faire la différence entre un champ qui nécessite un nom complet et un champ qui nécessite un prénom et un nom distincts.
  • Assister les interactions des agents dans les interfaces axées sur l'humain : certains champs sont conçus pour les utilisateurs humains, mais peuvent ne pas être compris par les agents. Vous pouvez créer un outil date_pick qui permet de sélectionner une date et une heure complexes dans une réservation ou une réservation d'événement.
  • Débogage plus rapide des applications : vous pouvez créer un outil run_diagnostics sur une page de paramètres de développeur, afin qu'un agent puisse déclencher des correctifs qui sont autrement masqués derrière des menus imbriqués.

Votre cas d'utilisation n'est pas mentionné ? Ou avez-vous une idée que vous souhaitez partager pour WebMCP ? Rejoignez le programme Preview et envoyez-nous vos commentaires.

Premiers pas

WebMCP est disponible en tant que flag Chrome pour le développement local. Il sera disponible dans un essai Origin Trial dans Chrome 149.

Pour activer WebMCP localement :

  1. Ouvrez Chrome et accédez à chrome://flags/#enable-webmcp-testing.
  2. Définissez le flag sur Activé.
  3. Relancez Chrome pour appliquer les modifications.

Utiliser les API WebMCP

Vous pouvez utiliser deux API pour configurer les outils de votre site Web :

  • API impérative : définissez différents types d'outils avec du code JavaScript standard, tels que la saisie de formulaire, les outils de navigation, la gestion des états ou d'autres fonctions.
  • API déclarative : ajoutez des annotations à des formulaires HTML standards pour créer un outil WebMCP.

Limites

Bien que WebMCP vise à simplifier les tâches complexes pour les agents et les humains, il existe certaines limites :

  • Contexte de navigation requis : étant donné que les appels d'outils sont gérés en JavaScript, un onglet de navigateur ou une vue Web doit être ouvert pour fournir une interface visible et un contexte de navigateur. En d'autres termes, les agents ou les outils d'assistance ne peuvent pas appeler d'outils en mode sans interface graphique.
  • Plus de surcharge pour les interfaces complexes : si votre site est très complexe, vous devrez probablement refactoriser ou ajouter du code JavaScript pour gérer l'état de l'application et de l'interface.
  • Découvrabilité des outils : les clients et les navigateurs doivent accéder directement à un site pour savoir s'il dispose d'outils appelables.

Démo

Des exemples de démonstrations couvrant les implémentations impératives et déclaratives sont disponibles :

Vous pouvez également consulter et explorer le code source de la démo sur GitHub.

Imiter la discussion avec un agent à l'aide de l'extension Inspector

Installez l'extension Model Context Tool Inspector pour tester un agent et voir comment les outils WebMCP fonctionnent dans des démonstrations en direct ou dans vos propres applications. Vous pouvez saisir des requêtes en langage naturel pour voir si un agent peut interagir correctement avec les outils WebMCP.

L'extension vous permet d'effectuer les opérations suivantes :

  • Voir les outils enregistrés sur une page en surveillant l'API navigator.modelContext.
  • Appeler manuellement des outils et exécuter des fonctions.
  • Vérifier que votre schéma JSON est correctement défini et que le navigateur peut analyser les données comme l'outil le prévoit.
  • Afficher la sortie structurée ou les messages d'erreur renvoyés par votre outil pour vous assurer qu'ils sont écrits clairement et correctement mis en forme, afin qu'un agent puisse les comprendre.

Parlez à l'agent en langage naturel pour voir s'il peut identifier et appeler correctement les outils WebMCP appropriés. Vos requêtes sont envoyées au modèle gemini-2.5-flash.

Participer et envoyer des commentaires

WebMCP fait l'objet de discussions actives et peut être modifié à l'avenir. Si vous essayez ces API et que vous avez des commentaires, n'hésitez pas à nous en faire part.