發布日期:2026 年 3 月 11 日
我們在 2 月宣布推出 WebMCP 搶先預覽計畫。隨著瀏覽器中的 AI 代理程式越來越常見,我們聽到網頁開發人員提出以下問題: 「WebMCP 會取代 Model Context Protocol (MCP) 嗎?」
雖然我瞭解您為什麼會提出這個問題,但這其實是基於誤解。您不必在 MCP 和 WebMCP 之間選擇,即可建立代理式體驗。WebMCP 並非 MCP 的擴充功能或替代方案,WebMCP 和 MCP 滿足的需求不同。WebMCP 可讓您說明應用程式功能的用途,並為瀏覽器代理程式提供額外功能,以便與您的網站互動。
這就像公司客服中心與店內專家之間的差異。
- MCP 隨時可在任何平台使用。並視需要提取資料及處理核心工作。
- WebMCP 僅適用於您的網站。網站通常是為人類設計的使用者介面,而非機器。WebMCP 可協助服務專員更瞭解 UI。
兩者合一,可協助代理程式代表使用者完成個人化工作。
功能和用途
這兩項技術的理念相同,都是要為應用程式提供標準化且可靠的方式,向 AI 代理公開工具。
實務上,這包括:
- 結構化工具探索:提供機器可讀取的方式,讓代理程式詢問「你可以做些什麼?」,並取得可用工具、參數和用途的清楚清單。
- 可預測的執行作業:以明確的函式呼叫取代猜測。代理會呼叫已定義的工具。這樣就能預測結果,不像模擬點擊模式可能會改變。
- 明確意圖:明確宣告功能。如果沒有 WebMCP 和 MCP,代理程式會根據對 UI 的瞭解,猜測要採取的動作。有了 WebMCP 和 MCP,代理程式就能確切瞭解特定功能應如何運作,而不需從 UI 元素推斷動作。
兩者之間的主要差異在於應用程式功能所在的位置。
MCP 適用於後端
模型上下文協定 (MCP) 是一項標準,可將 AI 代理 (無論是否以瀏覽器為基礎) 連接至外部系統,包括資料來源、工具和工作流程。這個通訊協定是通用的,通常使用 JSON-RPC,並透過 Rust、Python 和 TypeScript 等語言專屬的 SDK 實作。
WebMCP 適用於前端
WebMCP 是建議的瀏覽器標準,包含兩個專門與瀏覽器內建代理程式互動的 API。您可以使用 JavaScript 或 HTML 屬性實作這些 API。瀏覽器是網站與代理程式之間的通訊橋樑。
請將 WebMCP 視為一組「MCP 啟發式」API,而非 MCP 的直接 JavaScript 實作。WebMCP 專為瀏覽器打造,並省略各種伺服器端概念,例如資源。
控管代理程式存取網站的方式
WebMCP 可讓您控管代理與網站的互動方式。這項做法有幾項主要優點:
- 速度和可靠性:由於 WebMCP 使用瀏覽器的內部系統,因此用戶端與工具之間的通訊幾乎是即時的。不必等待往返遠端伺服器。
- 持久耐用:WebMCP 工具會連結至應用程式邏輯,而非設計。 也就是說,您可以重新設計網站,而不會影響代理程式與網站互動的能力。
- 由您掌控:您可以清楚定義代理程式與網站互動的首選方式,不必擔心代理程式找不到要點選的正確按鈕。您定義應用程式邏輯的方式必須讓代理程式瞭解,直接引導代理程式,而不是希望代理程式從 UI 推斷動作。
控管使用者介面存取權
如要瞭解兩者差異,請思考「誰擁有 UI?」MCP 應用程式會在代理程式 UI 中算繪應用程式的 UI。您的介面必須符合這些限制,且需要新的獨立應用程式。
WebMCP 可協助服務專員與現有網站即時互動。擴充功能可以存取即時工作階段資料、Cookie 和 DOM 元素,這些資料只會顯示在即時瀏覽器分頁中。應用程式不會成為代理程式的訪客,而是代理程式成為您平台的訪客。
重要事項:WebMCP 工具是暫時性的。只有在頁面開啟時才會存在。使用者離開網站或關閉分頁後,服務專員就無法再存取網站或採取行動。
使用 WebMCP 和 MCP
為特定功能或函式選擇合適的解決方案時,請考量情境和可用性:
| MCP | WebMCP | |
|---|---|---|
| Purpose | 讓服務專員隨時隨地存取資料和執行動作。 | 當使用者造訪網站時,讓即時網站準備好與服務專員互動。 |
| 生命週期 | 持續性 (伺服器和 Daemon) | 暫時性 (與分頁綁定) |
| 連線能力 | 全球 (電腦、行動裝置、雲端、網站) | 特定環境 (瀏覽器代理程式) |
| UI 互動 | 無頭和外部 | 整合瀏覽器和 DOM 感知 |
| 探索 | 專屬代理商的註冊流程 | 使用者造訪網頁時註冊的工具。 |
| 用途 | 執行背景 API 動作。 | 在即時網頁版 UI 中導覽及執行動作。 |
最有效的代理應用程式會同時使用 MCP 和 WebMCP,充分發揮這兩項技術的優勢。
- 使用 MCP 管理核心邏輯:MCP 伺服器會做為基礎服務層。負責處理核心商業邏輯、擷取資料和執行背景工作。這可確保服務與平台無關,且代理程式隨時都能使用。
- 使用 WebMCP 建構情境式 UI:WebMCP 是最後一個步驟,可讓代理程式直接連線至您的網站。這項功能專為瀏覽器內的情境式互動而設計,可讓代理程式在使用者開啟網站時,代表使用者快速可靠地執行動作。
請將 MCP 和 WebMCP 視為合作夥伴,而非競爭對手。WebMCP 可讓瀏覽器型 AI 代理程式以高保真度與使用者在分頁中看到的特定世界互動。
後續步驟
準備好讓網站支援代理程式了嗎?立即加入搶先體驗方案,開始試用 WebMCP。
你的意見回饋能幫助我們持續強化這項標準,