WebMCP

Alexandra Klepper
Alexandra Klepper

發布日期:2026 年 5 月 18 日

WebMCP 是建議的網頁標準,可協助您建構及公開 AI 代理的結構化工具。WebMCP 會提供 JavaScript 並註解 HTML 表單元素,讓代理程式確切瞭解如何與網頁功能互動,進而提升使用者體驗。這可大幅提升代理程式啟動的效能和可靠性。

AI 代理程式是較新的技術,這類 AI 助理可協助使用者完成高度複雜的技術性工作。WebMCP 可提高代理程式完成任務的準確度,並可做為漸進增強功能新增。

為什麼要使用 WebMCP?

WebMCP 可提供互動規則,協助您縮小網頁應用程式與代理之間的差距,進而提升效率、可靠性和工作完成度。網站會宣告元素 (例如按鈕或欄位) 的用途,因此系統會正確使用元素,不必由專員審查元素來瞭解用途

這比啟動更可靠,因為啟動可能包含許多步驟,且每個步驟都可能由代理人解讀。

網站可以定義工具,分享明確用途,例如搜尋或購物。這些工具會在網頁上執行,因此使用者會相信工作能如預期完成。同時保留品牌和以人為本的設計選擇。

WebMCP 支援:

  • 探索:網頁向代理程式 (例如 checkoutfilter_results) 註冊工具的標準方式。
  • JSON 結構定義:明確定義輸入內容和預期輸出內容,減少模型產生錯覺或誤解。
  • 狀態:共同瞭解目前頁面內容,讓代理程式即時掌握可用的資源。

我們的目標是建構 API,讓任何具備代理能力的瀏覽器都能實作並從中獲益,方便使用者完成工作。您可以在 GitHub 上按照這個程序操作。

用途

您可以在網路上透過多種方式使用 WebMCP。例如:

  • 協助顧客取得支援。如果您為顧客提供軟體,可能需要複雜的支援流程,才能解決各種問題。你可以使用 WebMCP,協助服務專員更快找到正確表單,並填入使用者提供的資訊。
  • 提升旅遊預訂體驗。協助服務專員以較少的步驟,預訂複雜的多停點和多乘客行程。

部分動作可能屬於敏感動作,例如購物。您可以加入指令,要求使用者透過確認對話方塊互動。

實務上,您的工具可以完成下列工作:

  • 填寫結構化表單:建構 submit_application 工具,協助服務專員正確將與使用者對話中收集到的資料對應至表單欄位。舉例來說,您可以區分欄位是否需要全名,還是需要分開提供名字和姓氏。
  • 在以人為本的介面中支援服務專員互動:某些欄位是為人類使用者設計,但代理程式可能無法理解。您可以建構 date_pick 工具,在預約或活動預訂中選取複雜的日期和時間。
  • 加快應用程式偵錯速度:您可以在開發人員設定頁面中建立 run_diagnostics 工具,讓代理程式觸發修正,否則這些修正會隱藏在巢狀選單中。

找不到適合的用途嗎?或者,您有很棒的想法想分享給 WebMCP 嗎?加入搶先體驗計畫,分享您的意見。

開始使用

WebMCP 可做為 Chrome 旗標,用於本機開發作業。這項功能將在 Chrome 149 的來源試用中推出。

如要在本機啟用 WebMCP,請按照下列步驟操作:

  1. 開啟 Chrome 並前往 chrome://flags/#enable-webmcp-testing
  2. 將旗標設為「啟用」
  3. 重新啟動 Chrome 即可套用變更。

使用 WebMCP API

您可以使用下列兩個 API 設定網站工具:

  • 命令式 API:使用標準 JavaScript 定義不同類型的工具,例如表單輸入、導覽工具、狀態管理或其他函式。
  • 宣告式 API:在標準 HTML 表單中加入註解,即可建立 WebMCP 工具。

限制

WebMCP 的目標是簡化代理和人類的複雜工作,但仍有以下限制:

  • 需要瀏覽環境:由於工具呼叫是在 JavaScript 中處理,因此必須開啟瀏覽器分頁或 WebView,才能提供可見的介面和瀏覽器環境。換句話說,代理程式或輔助工具無法在無頭狀態下呼叫工具。
  • 複雜介面的額外負荷較大:如果網站非常複雜,您可能需要重構或新增 JavaScript,以處理應用程式和介面狀態。
  • 工具可探索性:用戶端和瀏覽器必須直接造訪網站,才能知道網站是否有可呼叫的工具。

示範

我們提供命令式和宣告式導入的範例:

您也可以在 GitHub 上查看及探索範例原始碼。

使用檢查器擴充功能模擬服務專員的即時通訊

安裝 Model Context Tool Inspector 擴充功能,即可試用代理程式,並在即時示範或您自己的應用程式中,瞭解 WebMCP 工具的運作方式。您可以輸入自然語言提示,確認代理是否能正確與 WebMCP 工具互動。

有了擴充功能,你就能:

  • 監控 navigator.modelContext API,即可查看網頁上註冊的工具。
  • 手動呼叫工具並執行函式。
  • 確認 JSON 結構定義正確無誤,且瀏覽器可按照工具預期的方式剖析資料。
  • 查看工具傳回的結構化輸出內容或錯誤訊息,確保內容清楚明瞭且格式正確,方便服務專員瞭解。

使用自然語言與代理交談,確認代理是否能正確識別及呼叫適當的 WebMCP 工具。系統預設會將提示傳送至 gemini-3-flash-preview 模型。

參與討論及分享意見

WebMCP 目前仍在討論階段,日後可能會有變動。如果您試用這些 API 並有任何意見,歡迎與我們分享。