WebMCP

Alexandra Klepper
Alexandra Klepper

Published: May 18, 2026

WebMCP 是一项 拟议的网络标准,旨在帮助您为 AI 智能体构建和公开结构化工具。WebMCP 提供 JavaScript 并为 HTML 表单元素添加注释,以便智能体确切了解如何与页面功能互动,从而支持用户体验。这可以显著提高智能体执行的性能和可靠性。

AI 智能体是一项较新的技术。它们可以帮助人类用户更好地完成高度复杂的技术任务。WebMCP 可以提高智能体完成任务的准确性,并且可以作为渐进增强功能添加。

为什么要使用 WebMCP?

WebMCP 可以通过提供互动规则,帮助您弥合 Web 应用与智能体之间的差距,从而提高效率、可靠性和任务完成度。网站会声明元素(例如按钮或字段)的用途,而不是让智能体查看元素以了解其用途,因此可以确保元素得到正确使用

这比执行更可靠,因为执行可能包含许多步骤,并且每个步骤都可能被智能体以不同的方式解读。

网站可以通过定义工具 来分享明确的用途,例如搜索或购买。这些工具会在您的网页上以可见的方式执行,因此用户可以确信任务会按预期完成。这还可以确保您的品牌和以人为本的设计选择保持不变。

WebMCP 支持:

  • 发现:一种标准方式,供页面向智能体注册工具,例如 checkoutfilter_results
  • JSON 架构:明确定义输入和预期输出,以减少幻觉或误解。
  • 状态:对当前页面上下文的共同理解,以便智能体了解哪些资源可供实时操作。

我们的目标是构建任何具有智能体功能的浏览器都可以实现并从中受益的 API,以便您的用户可以更轻松地完成任务。您 可以在 GitHub上关注此过程。

使用场景

您可以通过多种方式在网络上使用 WebMCP。例如:

  • 帮助客户获得支持 。如果您向客户提供软件,则可能需要复杂的支持流程来解决许多不同的问题。您可以使用 WebMCP 帮助智能体更快地导航到正确的表单,并使用用户提供的信息填写字段。
  • 改进旅行预订 。帮助客服人员以更少的步骤预订复杂的多城市和多乘客行程。

某些操作可能比较敏感,例如进行购买。您可以添加一个命令,以请求用户与确认对话框互动。

实际上,您的工具可以完成以下任务:

  • 填写结构化表单:构建 submit_application 工具,帮助智能体将从与用户的对话中收集的数据正确映射到表单字段。例如,您可以区分字段是需要全名,还是需要单独的姓氏和名字。
  • 在以人为本的界面中支持智能体互动:某些字段是 为人类用户设计的,但智能体可能无法理解。您可以构建一个 date_pick 工具,以便在预订或活动预订中选择复杂的日期和时间。
  • 更快地调试应用:您可以在开发者设置页面上构建 run_diagnostics 工具,以便智能体触发修复,否则这些修复会隐藏在嵌套菜单后面。

您是否缺少使用场景?或者,您是否有想要分享的 WebMCP 想法?加入抢先体验计划 并分享您的反馈。

开始使用

WebMCP 可作为 Chrome flag 用于本地开发。它将在 Chrome 149 中进行 源试用

如需在本地启用 WebMCP,请执行以下操作:

  1. 打开 Chrome,然后前往 chrome://flags/#enable-webmcp-testing
  2. 将标志设置为已启用
  3. 重新启动 Chrome 以应用更改。

使用 WebMCP API

您可以使用以下两个 API 来设置网站工具:

  • 命令式 API:使用标准 JavaScript 定义不同类型的 工具,例如表单输入、导航工具、状态 管理或其他功能。
  • 声明式 API:向标准 HTML 表单添加注释以创建 WebMCP 工具。

限制

虽然 WebMCP 旨在让智能体和人类更轻松地完成复杂任务,但仍存在一些限制:

  • 需要浏览上下文:由于工具调用是在 JavaScript 中处理的, 因此必须打开浏览器标签页或 WebView,以提供可见的界面和 浏览器上下文。换句话说,不支持智能体或辅助工具在无头状态下调用工具。
  • 复杂界面的开销更大:如果您的网站非常复杂,则可能需要重构或添加 JavaScript 来处理应用和界面状态。
  • 工具可发现性:客户端和浏览器必须直接访问网站,才能知道网站是否具有可调用的工具。

演示

以下是一些演示示例,涵盖命令式实现和声明式实现:

您还可以在 GitHub 上查看和探索演示源代码。

使用检查器扩展程序模拟智能体聊天

安装模型上下文工具检查器扩展程序,以试用智能体,并了解 WebMCP 工具在实时演示或您自己的应用中的工作方式。您可以输入自然语言提示,以查看智能体是否可以正确与 WebMCP 工具互动。

借助该扩展程序,您可以:

  • 通过监控 navigator.modelContext API,查看页面上注册了哪些工具。
  • 手动调用工具并执行函数。
  • 验证您的 JSON 架构是否定义正确,以及浏览器是否可以按照工具的预期解析数据。
  • 查看工具返回的结构化输出或错误消息,确保它们编写清晰且格式正确,以便智能体能够理解。

使用自然语言与智能体交谈,以查看智能体是否可以正确识别和调用相应的 WebMCP 工具。您的提示会发送到 gemini-2.5-flash 模型。

参与互动并分享反馈

WebMCP 正在积极讨论中,将来可能会发生变化。如果您试用了这些 API 并有反馈,我们非常乐意倾听。