WebMCP

Alexandra Klepper
Alexandra Klepper

Fecha de publicación: 18 de mayo de 2026

WebMCP es un estándar web propuesto para ayudarte a compilar y exponer herramientas estructuradas para agentes de IA agentes. WebMCP proporciona JavaScript y anota elementos de formulario HTML para que los agentes sepan exactamente cómo interactuar con las funciones de la página y admitir la experiencia de un usuario. Esto puede mejorar significativamente el rendimiento y la confiabilidad de la activación del agente.

Los agentes de IA son una tecnología más reciente. Pueden ayudar a los usuarios humanos a completar mejor las tareas que son muy complejas y técnicas. WebMCP ofrece una mayor precisión para la finalización de tareas de agente y se puede agregar como una mejora progresiva.

¿Por qué WebMCP?

WebMCP puede ayudarte a cerrar la brecha entre las aplicaciones web y los agentes, lo que mejora la eficiencia, la confiabilidad y la finalización de tareas, ya que proporciona reglas para la interacción. En lugar de que un agente revise el elemento, como un botón o un campo, para comprender su propósito, el sitio web declara el propósito del elemento, por lo que se usa correctamente.

Esto es más confiable que la activación, que puede tener varios pasos y deja cada paso abierto a la interpretación del agente.

Los sitios web pueden compartir un propósito explícito, como la búsqueda o la compra, mediante la definición de una herramienta. Estas herramientas se ejecutan de forma visible en tu página web, por lo que los usuarios confían en que las tareas se completan según lo previsto. Esto también mantiene intactas las opciones de diseño centradas en la marca y en los usuarios.

WebMCP admite lo siguiente:

  • Discovery: Es una forma estándar para que las páginas registren herramientas con agentes, como checkout o filter_results.
  • Esquemas JSON: Son definiciones explícitas de entradas y salidas esperadas para reducir la alucinación o la falta de comprensión.
  • Estado: Es una comprensión compartida del contexto actual de la página, de modo que el agente sepa qué recursos están disponibles para actuar en tiempo real.

Nuestro objetivo es compilar APIs que cualquier navegador con capacidades de agente pueda implementar y aprovechar, de modo que los usuarios puedan completar tareas con mayor facilidad. Puedes seguir este proceso en GitHub.

Casos de uso

Hay muchas formas de usar WebMCP en la Web. Por ejemplo:

  • Ayuda a tus clientes a obtener asistencia. Si proporcionas un software a los clientes, es posible que tengas un flujo de asistencia complejo para abordar muchas preguntas diferentes. Puedes usar WebMCP para ayudar a un agente a navegar más rápido al formulario correcto y completar los campos con la información proporcionada por el usuario.
  • Mejora la reserva de viajes. Ayuda a los agentes a reservar viajes complejos de varias ciudades y varios pasajeros con menos pasos.

Algunas acciones pueden ser sensibles, como realizar una compra. Puedes incluir un comando para solicitar la interacción del usuario con un diálogo de confirmación.

En un sentido práctico, tus herramientas podrían realizar las siguientes tareas:

  • Completar formularios estructurados: Compila una herramienta submit_application para ayudar a los agentes a asignar correctamente los datos recopilados de la conversación con el usuario a los campos del formulario. Por ejemplo, puedes diferenciar si un campo requiere un nombre completo en lugar de un nombre y apellido separados.
  • Admitir interacciones de agentes en interfaces centradas en los usuarios: Ciertos campos están diseñados para usuarios humanos, pero es posible que los agentes no los comprendan. Puedes compilar una herramienta date_pick que permita una selección compleja de fecha y hora en una reserva o reserva de eventos.
  • Depuración más rápida de aplicaciones: Puedes compilar una herramienta run_diagnostics en una página de configuración para desarrolladores, de modo que un agente pueda activar correcciones que, de lo contrario, estén ocultas detrás de menús anidados.

¿Falta tu caso de uso? ¿O tienes una idea que te entusiasma compartir para WebMCP? Únete al programa de versión preliminar anticipada y comparte tus comentarios.

Comenzar

WebMCP está disponible como una función experimental de Chrome para el desarrollo local. Estará disponible en una prueba de origen en Chrome 149.

Para habilitar WebMCP de forma local, haz lo siguiente:

  1. Abre Chrome y navega a chrome://flags/#enable-webmcp-testing.
  2. Configura la marca en Habilitado.
  3. Vuelve a iniciar Chrome para aplicar los cambios.

Usa las APIs de WebMCP

Existen dos APIs que puedes usar para configurar las herramientas de tu sitio web:

  • API imperativa: Define diferentes tipos de herramientas con JavaScript estándar, como entrada de formularios, herramientas de navegación, administración de estados o cualquier otra función.
  • API declarativa: Agrega anotaciones a formularios HTML estándar para crear una herramienta de WebMCP.

Limitaciones

Si bien WebMCP tiene como objetivo simplificar las tareas complejas para los agentes y los usuarios, existen algunas limitaciones:

  • Contexto de navegación obligatorio: Como las llamadas a herramientas se controlan en JavaScript, se debe abrir una pestaña del navegador o una vista web para proporcionar una interfaz visible y un contexto del navegador. En otras palabras, no hay compatibilidad con agentes ni herramientas de asistencia para llamar a herramientas en un estado sin interfaz gráfica.
  • Más sobrecarga para interfaces complejas: Si tu sitio es muy complejo, es probable que necesites refactorizar o agregar JavaScript para controlar el estado de la aplicación y la interfaz.
  • Visibilidad de la herramienta: Los clientes y los navegadores deben visitar un sitio directamente para saber si tiene herramientas que se pueden llamar.

Demostración

Existen ejemplos de demostraciones que abarcan implementaciones imperativas y declarativas:

También puedes revisar y explorar el código fuente de la demostración en GitHub.

Imita el chat del agente con la extensión del inspector

Instala la extensión del inspector de herramientas de contexto del modelo para experimentar con un agente y ver cómo funcionan las herramientas de WebMCP en demostraciones en vivo o en tus propias aplicaciones. Puedes ingresar instrucciones en lenguaje natural para ver si un agente puede interactuar correctamente con las herramientas de WebMCP.

Con la extensión, puedes hacer lo siguiente:

  • Supervisar la API de navigator.modelContext para ver qué herramientas están registradas en una página
  • Llamar a herramientas y ejecutar funciones de forma manual
  • Verificar que el esquema JSON esté definido correctamente y que el navegador pueda analizar los datos como espera la herramienta
  • Ver la salida estructurada o los mensajes de error que muestra tu herramienta para asegurarte de que estén escritos con claridad y tengan el formato correcto, de modo que un agente pueda comprenderlos

Habla con el agente en lenguaje natural para ver si puede identificar y llamar correctamente a las herramientas de WebMCP adecuadas. Tus instrucciones se envían de forma predeterminada al modelo gemini-3-flash-preview.

Participa y comparte comentarios

WebMCP está en debate activo y está sujeto a cambios en el futuro. Si pruebas estas APIs y tienes comentarios, nos encantaría escucharlos.