WebMCP

Alexandra Klepper
Alexandra Klepper

Xuất bản: Ngày 18 tháng 5 năm 2026, Lần cập nhật gần đây nhất: Ngày 9 tháng 6 năm 2026

WebMCP là một tiêu chuẩn web được đề xuất để giúp bạn xây dựng và hiển thị các công cụ có cấu trúc cho tác nhân AI. WebMCP cung cấp JavaScript và chú thích các phần tử biểu mẫu HTML để nhân viên hỗ trợ biết chính xác cách tương tác với các tính năng trên trang, nhằm hỗ trợ trải nghiệm của người dùng. Điều này có thể cải thiện đáng kể hiệu suất và độ tin cậy của hoạt động kích hoạt tác nhân.

Tác nhân AI là một công nghệ mới. Tác nhân AI có thể giúp người dùng hoàn thành tốt hơn những nhiệm vụ có độ phức tạp cao và mang tính kỹ thuật. WebMCP mang lại độ chính xác cao hơn khi hoàn thành nhiệm vụ của tác nhân và có thể được thêm vào dưới dạng một tính năng nâng cao tăng dần.

Tại sao nên sử dụng WebMCP?

WebMCP có thể giúp bạn thu hẹp khoảng cách giữa các ứng dụng web và tác nhân, cải thiện hiệu quả, độ tin cậy và khả năng hoàn thành nhiệm vụ bằng cách cung cấp các quy tắc tương tác. Thay vì một tác nhân xem xét phần tử (chẳng hạn như nút hoặc trường) để hiểu mục đích của phần tử đó, trang web sẽ khai báo mục đích của phần tử để phần tử đó được sử dụng đúng cách

Điều này đáng tin cậy hơn so với hành động, có thể có nhiều bước và để mỗi bước mở ra cho tác nhân diễn giải.

Các trang web có thể chia sẻ mục đích rõ ràng, chẳng hạn như tìm kiếm hoặc mua hàng, bằng cách xác định tool. Các công cụ thực thi trên trang web của bạn một cách rõ ràng, vì vậy, người dùng sẽ tin tưởng rằng các tác vụ được hoàn tất như mong đợi. Điều này cũng giúp thương hiệu và các lựa chọn thiết kế lấy con người làm trung tâm của bạn được giữ nguyên.

WebMCP hỗ trợ:

  • Khám phá: Một cách tiêu chuẩn để các trang đăng ký công cụ với các tác nhân, chẳng hạn như checkout hoặc filter_results.
  • Giản đồ JSON: Định nghĩa rõ ràng về dữ liệu đầu vào và đầu ra dự kiến, nhằm giảm hiện tượng ảo giác hoặc hiểu lầm.
  • Trạng thái: Hiểu rõ bối cảnh hiện tại của trang, nhờ đó, tác nhân biết những tài nguyên có sẵn để hành động theo thời gian thực.

Mục tiêu của chúng tôi là xây dựng những API mà mọi trình duyệt có khả năng thực hiện hành động đều có thể triển khai và hưởng lợi, nhờ đó người dùng của bạn có thể dễ dàng hoàn thành các tác vụ hơn. Bạn có thể theo dõi quy trình này trên GitHub.

Trường hợp sử dụng

Bạn có thể sử dụng WebMCP trên web theo nhiều cách. Ví dụ:

  • Giúp khách hàng nhận được sự hỗ trợ. Nếu cung cấp phần mềm cho khách hàng, bạn có thể có một quy trình hỗ trợ phức tạp để giải quyết nhiều câu hỏi khác nhau. Bạn có thể sử dụng WebMCP để giúp nhân viên hỗ trợ nhanh chóng chuyển đến biểu mẫu phù hợp và điền thông tin do người dùng cung cấp vào các trường.
  • Cải thiện quy trình đặt vé du lịch. Giúp nhân viên đặt những chuyến đi phức tạp, nhiều thành phố và nhiều hành khách chỉ trong vài bước.

Một số hành động có thể nhạy cảm, chẳng hạn như mua hàng. Bạn có thể thêm một lệnh để yêu cầu người dùng tương tác với hộp thoại xác nhận.

Trên thực tế, các công cụ của bạn có thể hoàn thành những việc sau:

  • Điền vào các biểu mẫu có cấu trúc: Tạo một công cụ submit_application để giúp các nhân viên hỗ trợ liên kết chính xác dữ liệu thu thập được từ cuộc trò chuyện với người dùng vào các trường trong biểu mẫu. Ví dụ: bạn có thể phân biệt xem một trường có yêu cầu tên đầy đủ hay chỉ yêu cầu họ và tên riêng biệt.
  • Tương tác của nhân viên hỗ trợ trong giao diện ưu tiên người dùng: Một số trường được thiết kế cho người dùng, nhưng có thể không được các tác nhân hiểu. Bạn có thể tạo một công cụ date_pick cho phép chọn ngày và giờ phức tạp trong một lượt đặt chỗ hoặc đặt sự kiện.
  • Gỡ lỗi ứng dụng nhanh hơn: Bạn có thể tạo một công cụ run_diagnostics trên trang cài đặt cho nhà phát triển, nhờ đó, một tác nhân có thể kích hoạt các bản sửa lỗi nếu không thì sẽ bị ẩn sau các trình đơn lồng nhau.

Bạn có thấy thiếu trường hợp sử dụng nào không? Hoặc bạn có ý tưởng nào muốn chia sẻ cho WebMCP không? Tham gia chương trình dùng thử sớm và chia sẻ ý kiến phản hồi của bạn.

Bắt đầu

Tham gia thử nghiệm theo nguyên gốc WebMCP từ Chrome 149. Tìm hiểu thêm về cách bắt đầu dùng thử nguồn gốc.

WebMCP cục bộ

WebMCP có sẵn dưới dạng cờ Chrome để phát triển cục bộ:

  1. Mở Chrome rồi chuyển đến chrome://flags/#enable-webmcp-testing
  2. Đặt cờ thành Đã bật.
  3. Khởi chạy lại Chrome để áp dụng các thay đổi.

Sử dụng WebMCP API

Bạn có thể sử dụng 2 API để thiết lập các công cụ trên trang web:

  • API mệnh lệnh: Xác định nhiều loại công cụ bằng JavaScript tiêu chuẩn, chẳng hạn như đầu vào biểu mẫu, công cụ điều hướng, quản lý trạng thái hoặc các chức năng khác.
  • API khai báo: Thêm chú thích vào các biểu mẫu HTML tiêu chuẩn để tạo một công cụ WebMCP.

Các điểm hạn chế

Mặc dù WebMCP hướng đến việc đơn giản hoá các tác vụ phức tạp cho tác nhân và con người, nhưng vẫn có một số hạn chế:

  • Yêu cầu về bối cảnh duyệt web: Vì các lệnh gọi công cụ được xử lý trong JavaScript, nên bạn phải mở một thẻ trình duyệt hoặc webview để cung cấp giao diện hiển thị và bối cảnh trình duyệt. Nói cách khác, không có hỗ trợ cho các tác nhân hoặc công cụ hỗ trợ để gọi các công cụ ở trạng thái không có giao diện người dùng.
  • Tốn nhiều chi phí hơn cho các giao diện phức tạp: Nếu trang web của bạn có độ phức tạp cao, thì bạn có thể cần tái cấu trúc hoặc thêm JavaScript để xử lý trạng thái ứng dụng và giao diện.
  • Khả năng khám phá công cụ: Các ứng dụng và trình duyệt phải truy cập trực tiếp vào một trang web để biết trang web đó có các công cụ có thể gọi hay không.

Tính bảo mật và quyền truy cập

Các API WebMCP được kiểm soát bằng cả yêu cầu tách biệt nguồn gốc và chính sách về quyền.

Tách biệt nguồn gốc

WebMCP chỉ có trong các tài liệu được cách ly theo nguồn gốc. Điều này đảm bảo rằng nguồn gốc của tài liệu vẫn ổn định trong suốt thời gian hoạt động của công cụ.

Nếu một tài liệu đã bật document.domain (ví dụ: bằng cách sử dụng tiêu đề HTTP Origin-Agent-Cluster: ?0), thì các API WebMCP sẽ bị vô hiệu hoá.

Chính sách về quyền

Cả hai API đều được kiểm soát bằng tools Permissions Policy (Chính sách về quyền). Chính sách này mặc định là self, cho phép đăng ký công cụ trong các bối cảnh cấp cao nhất và cùng nguồn gốc, đồng thời vô hiệu hoá công cụ này cho các iframe tách biệt nhiều nguồn gốc.

Để cho phép các công cụ WebMCP trong một iframe trên nhiều nguồn gốc, hãy thêm thuộc tính allow="tools" vào iframe.

Bản minh hoạ

Sau đây là ví dụ về các bản minh hoạ bao gồm cả việc triển khai bắt buộc và khai báo:

Bạn cũng có thể xem xét và khám phá mã nguồn của bản minh hoạ trên GitHub.

Mô phỏng cuộc trò chuyện với nhân viên hỗ trợ bằng tiện ích trình kiểm tra

Cài đặt Tiện ích Trình kiểm tra bối cảnh mô hình để thử nghiệm với một tác nhân và xem cách các công cụ WebMCP hoạt động trong bản minh hoạ trực tiếp hoặc các ứng dụng của riêng bạn. Sử dụng câu lệnh bằng ngôn ngữ tự nhiên để xác định xem tác nhân có tương tác với các công cụ WebMCP như mong đợi hay không.

Với tiện ích này, bạn có thể:

  • Xem những công cụ nào được đăng ký trên một trang bằng cách giám sát API WebMCP.
  • Gọi công cụ và thực thi các hàm theo cách thủ công.
  • Xác minh rằng bạn đã xác định đúng Cấu trúc JSON và trình duyệt có thể phân tích cú pháp dữ liệu như công cụ mong đợi.
  • Xem đầu ra có cấu trúc hoặc thông báo lỗi do công cụ của bạn trả về để đảm bảo chúng được viết rõ ràng và định dạng chính xác, nhờ đó, một tác nhân có thể hiểu được.

Nói chuyện với tác nhân bằng ngôn ngữ tự nhiên để xem tác nhân có thể xác định và gọi đúng các công cụ WebMCP hay không. Theo mặc định, câu lệnh của bạn sẽ được gửi đến mô hình gemini-3-flash-preview.

Tương tác và chia sẻ ý kiến phản hồi

WebMCP đang được thảo luận tích cực và có thể thay đổi trong tương lai. Nếu bạn dùng thử các API này và có ý kiến phản hồi, chúng tôi rất mong được lắng nghe.