发布时间:2026 年 3 月 11 日
2 月份,我们宣布 WebMCP 可用于抢先预览计划。随着 AI 代理在浏览器中变得越来越普遍,我们听到 Web 开发者提出以下问题:“WebMCP 会取代 Model Context Protocol (MCP) 吗?”
虽然我理解您为何会提出这个问题,但这是基于误解。您无需在 MCP 和 WebMCP 之间做出选择,即可打造智能体体验。WebMCP 不是 MCP 的扩展或替代品。实际上,WebMCP 和 MCP 可满足不同的需求。借助 WebMCP,您可以明确应用功能的用途,并为浏览器代理提供与您的网站互动的额外功能。
一个很好的类比是公司客户服务呼叫中心与实体店专家之间的区别。
- MCP 可在任何平台上的任何时间使用。它可以根据需要提取数据并处理核心任务。
- WebMCP 只能在您的网站上使用。网站通常是为人类而非机器设计的用户界面 (UI)。WebMCP 可帮助代理更好地了解界面。
它们共同帮助智能体代表人类用户完成个性化任务。
功能和用途
这两种技术秉持着相同的理念:为应用提供一种标准化且可靠的方式,以便向 AI 智能体公开其工具。
在实践中,这包括:
- 结构化工具发现:它们提供了一种机器可读的方式,让 Agent 可以询问“你能做什么?”,并获得一份清晰的可用工具列表,其中包含工具的参数和用途。
- 可预测的执行:它们使用明确的函数调用取代了猜测。智能体调用已定义的工具。这样可实现可预测的结果,而模拟可能会发生变化的点击模式则无法实现这一点。
- 意图明确:它们明确声明了功能。如果没有 WebMCP 和 MCP,代理会根据对界面的了解来猜测要采取的操作。借助 WebMCP 和 MCP,代理可以确切地知道特定功能应如何运作,而无需从界面元素中推断操作。
它们之间的主要区别在于应用功能所在的位置。
MCP 适用于后端
Model Context Protocol (MCP) 是一种将 AI 智能体(无论是否基于浏览器)与外部系统(包括数据源、工具和工作流)连接起来的标准。该协议是通用的,通常使用 JSON-RPC,并通过特定于语言的 SDK(例如 Rust、Python 和 TypeScript)来实现。
WebMCP 适用于前端
WebMCP 是一项提议的浏览器标准,包含两个专门与浏览器内置代理互动的 API。您可以使用 JavaScript 或 HTML 属性来实现这些 API。浏览器充当网站与代理之间的通信器。
请将 WebMCP 视为一组“受 MCP 启发”的 API,而不是 MCP 的直接 JavaScript 实现。WebMCP 专为浏览器而构建,省略了各种服务器端概念,例如资源。
控制代理访问您网站的方式
借助 WebMCP,您可以控制智能体与您网站的互动方式。这样做有以下几项主要优势:
- 速度和可靠性:由于 WebMCP 使用浏览器的内部系统,因此客户端与工具之间的通信几乎是即时的。您无需等待往返远程服务器。
- 经久耐用:WebMCP 工具连接到应用逻辑,而不是设计。这意味着您可以重新设计网站,而不会影响代理正确与之互动的能力。
- 您可自行掌控:您可以明确定义代理与您网站互动的方式,而无需寄希望于代理找到要点击的正确按钮。您以智能体能够理解的方式定义应用的逻辑,直接引导智能体,而不是希望它们从界面中推断出操作。
控制界面访问权限
为了了解其中的区别,请考虑“谁拥有界面?”MCP 应用会在代理界面中呈现应用的界面。您的界面必须符合这些限制条件,并且需要一个单独的新应用。
WebMCP 可帮助代理实时与您的现有网站互动。它可以访问仅在实时浏览器标签页中提供的实时会话数据、Cookie 和 DOM 元素。您的应用不再是代理中的访客,而是代理成为平台上的访客。
重要的是,WebMCP 工具是临时性的。只有在您的网页处于打开状态时,它们才会存在。用户离开您的网站或关闭标签页后,客服人员将无法再访问您的网站或采取任何行动。
使用 WebMCP 和 MCP
在为特定功能或函数选择合适的解决方案时,请考虑上下文和可用性:
| MCP | WebMCP | |
|---|---|---|
| 用途 | 让客服人员随时随地都能获取数据和执行操作。 | 让实时网站在用户访问时可立即与代理互动。 |
| Lifecycle | 持久(服务器和守护程序) | 临时(标签页绑定) |
| 连接性 | 全球(桌面设备、移动设备、云端、网站) | 特定于环境(浏览器代理) |
| 界面互动 | 无头和外部 | 集成到浏览器中并可识别 DOM |
| 发现广告系列 | 智能体专用注册流程 | 用户访问网页期间在网页上注册的工具。 |
| 用例 | 执行后台 API 操作。 | 在实时网页界面上导航和操作。 |
最有效的智能体应用会同时使用 MCP 和 WebMCP,以充分利用这两种技术的优势。
- 使用 MCP 管理核心逻辑:您的 MCP 服务器充当基础服务层。它负责处理核心业务逻辑、数据检索和后台任务。这样可确保您的服务与平台无关,并且始终可供代理使用。
- 使用 WebMCP 构建情境化界面:WebMCP 是最后一步,可让代理直接连接到您的网站。它专为情境化浏览器内互动而设计,可让代理在用户打开您的网站时快速可靠地代表用户执行操作。
请将 MCP 和 WebMCP 视为合作伙伴,而不是竞争对手。WebMCP 为基于浏览器的 AI 代理提供了一种高保真方式,使其能够与用户在其标签页中看到的特定世界进行互动。
后续操作
准备好让您的网站支持智能体了吗?您可以立即加入抢先试用计划,开始体验 WebMCP。
您的反馈对于确定此标准的未来发展方向至关重要。