WebMCP

Alexandra Klepper
Alexandra Klepper

Xuất bản: Ngày 18 tháng 5 năm 2026

WebMCP là một tiêu chuẩn web được đề xuất để giúp bạn xây dựng và hiển thị các công cụ có cấu trúc cho tác nhân AI. WebMCP cung cấp JavaScript và chú thích các phần tử biểu mẫu HTML để các tác nhân biết chính xác cách tương tác với các tính năng trên trang, nhằm hỗ trợ trải nghiệm của người dùng. Điều này có thể cải thiện đáng kể hiệu suất và độ tin cậy của quá trình kích hoạt tác nhân phần mềm.

Các tác nhân AI là một công nghệ mới hơn. Các mô hình này có thể giúp người dùng hoàn thành tốt hơn những nhiệm vụ có độ phức tạp và kỹ thuật cao. WebMCP mang lại độ chính xác cao hơn cho việc hoàn thành tác vụ tác nhân và có thể được thêm dưới dạng một cải tiến tăng dần.

Tại sao nên dùng WebMCP?

WebMCP có thể giúp bạn thu hẹp khoảng cách giữa các ứng dụng web và tác nhân, cải thiện hiệu quả, độ tin cậy và khả năng hoàn thành nhiệm vụ bằng cách cung cấp các quy tắc tương tác. Thay vì một tác nhân xem xét phần tử (chẳng hạn như nút hoặc trường) để hiểu mục đích của phần tử đó, trang web sẽ khai báo mục đích của phần tử để phần tử đó được sử dụng đúng cách

Cách này đáng tin cậy hơn so với cách kích hoạt, có thể có nhiều bước và mỗi bước đều có thể được diễn giải theo cách riêng của tác nhân.

Các trang web có thể chia sẻ mục đích rõ ràng, chẳng hạn như tìm kiếm hoặc mua hàng, bằng cách xác định một tool. Các công cụ thực thi trên trang web của bạn một cách rõ ràng, vì vậy người dùng sẽ tin tưởng rằng các tác vụ được hoàn thành như mong đợi. Điều này cũng giúp thương hiệu và các lựa chọn thiết kế lấy con người làm trung tâm của bạn không bị ảnh hưởng.

WebMCP hỗ trợ:

  • Khám phá: Cách tiêu chuẩn để các trang đăng ký công cụ với các tác nhân, chẳng hạn như checkout hoặc filter_results.
  • Giản đồ JSON: Định nghĩa rõ ràng về dữ liệu đầu vào và đầu ra dự kiến, nhằm giảm hiện tượng ảo giác hoặc hiểu lầm.
  • Trạng thái: Hiểu biết chung về bối cảnh trang hiện tại, nhờ đó, tác nhân biết những tài nguyên có sẵn để hành động theo thời gian thực.

Mục tiêu của chúng tôi là xây dựng các API mà mọi trình duyệt có khả năng của tác nhân AI đều có thể triển khai và hưởng lợi, nhờ đó người dùng của bạn có thể dễ dàng hoàn thành các tác vụ hơn. Bạn có thể theo dõi quy trình này trên GitHub.

Trường hợp sử dụng

Bạn có thể sử dụng WebMCP theo nhiều cách trên web. Ví dụ:

  • Giúp khách hàng nhận được sự hỗ trợ. Nếu cung cấp phần mềm cho khách hàng, bạn có thể có một quy trình hỗ trợ phức tạp để giải quyết nhiều câu hỏi khác nhau. Bạn có thể sử dụng WebMCP để giúp nhân viên hỗ trợ nhanh chóng chuyển đến biểu mẫu phù hợp và điền thông tin do người dùng cung cấp vào các trường.
  • Cải thiện quy trình đặt vé du lịch. Giúp nhân viên đặt những chuyến đi phức tạp, nhiều thành phố và nhiều hành khách chỉ trong vài bước.

Một số hành động có thể nhạy cảm, chẳng hạn như mua hàng. Bạn có thể thêm một lệnh để yêu cầu người dùng tương tác với hộp thoại xác nhận.

Trên thực tế, các công cụ của bạn có thể hoàn thành những việc sau:

  • Điền vào các biểu mẫu có cấu trúc: Tạo một công cụ submit_application để giúp các nhân viên hỗ trợ liên kết chính xác dữ liệu thu thập được từ cuộc trò chuyện với người dùng vào các trường trong biểu mẫu. Ví dụ: bạn có thể phân biệt xem một trường có yêu cầu tên đầy đủ hay chỉ yêu cầu họ và tên riêng biệt.
  • Tương tác của nhân viên hỗ trợ trong giao diện ưu tiên người dùng: Một số trường được thiết kế cho người dùng, nhưng có thể không được nhân viên hỗ trợ hiểu. Bạn có thể tạo một công cụ date_pick cho phép chọn ngày và giờ phức tạp trong một lượt đặt trước hoặc đặt sự kiện.
  • Gỡ lỗi ứng dụng nhanh hơn: Bạn có thể tạo một công cụ run_diagnostics trên trang cài đặt cho nhà phát triển, nhờ đó, một tác nhân có thể kích hoạt các bản sửa lỗi mà nếu không thì sẽ bị ẩn sau các trình đơn lồng nhau.

Bạn có thấy trường hợp sử dụng của mình bị thiếu không? Hoặc bạn có ý tưởng nào muốn chia sẻ cho WebMCP không? Tham gia chương trình dùng thử sớm và chia sẻ ý kiến phản hồi của bạn.

Bắt đầu

WebMCP có sẵn dưới dạng cờ Chrome để phát triển cục bộ. API này sẽ có trong bản dùng thử theo nguyên gốc trong Chrome 149.

Cách bật WebMCP cục bộ:

  1. Mở Chrome rồi chuyển đến chrome://flags/#enable-webmcp-testing
  2. Đặt trạng thái cờ thành Đã bật.
  3. Khởi chạy lại Chrome để áp dụng các thay đổi.

Sử dụng API WebMCP

Bạn có thể sử dụng 2 API để thiết lập các công cụ trên trang web:

  • API mệnh lệnh: Xác định nhiều loại công cụ bằng JavaScript tiêu chuẩn, chẳng hạn như đầu vào biểu mẫu, công cụ điều hướng, quản lý state hoặc các hàm khác.
  • API khai báo: Thêm chú thích vào các biểu mẫu HTML tiêu chuẩn để tạo một công cụ WebMCP.

Các điểm hạn chế

Mặc dù WebMCP hướng đến việc đơn giản hoá các tác vụ phức tạp cho các tác nhân và con người, nhưng vẫn có một số hạn chế:

  • Yêu cầu về bối cảnh duyệt web: Vì các lệnh gọi công cụ được xử lý trong JavaScript, nên bạn phải mở một thẻ trình duyệt hoặc webview để cung cấp giao diện hiển thị và bối cảnh trình duyệt. Nói cách khác, không có sự hỗ trợ nào cho các tác nhân hoặc công cụ hỗ trợ để gọi các công cụ ở trạng thái không có giao diện người dùng.
  • Tốn nhiều chi phí hơn cho các giao diện phức tạp: Nếu trang web của bạn có độ phức tạp cao, thì có thể bạn cần tái cấu trúc hoặc thêm JavaScript để xử lý trạng thái ứng dụng và giao diện.
  • Khả năng khám phá công cụ: Các ứng dụng và trình duyệt phải truy cập trực tiếp vào một trang web để biết trang web đó có các công cụ có thể gọi hay không.

Chính sách về quyền

Cả hai API đều được kiểm soát bằng tools Permissions Policy. Chính sách này mặc định là self, cho phép đăng ký công cụ trong các bối cảnh cấp cao nhất và cùng nguồn gốc, đồng thời vô hiệu hoá công cụ này cho các iframe tách biệt nhiều nguồn gốc.

Để cho phép các công cụ WebMCP trong một iframe trên nhiều nguồn gốc, hãy thêm thuộc tính allow="tools" vào iframe.

Bản minh hoạ

Sau đây là ví dụ về các bản minh hoạ bao gồm cả việc triển khai bắt buộc và khai báo:

Bạn cũng có thể xem xét và khám phá mã nguồn của bản minh hoạ trên GitHub.

Mô phỏng cuộc trò chuyện với nhân viên hỗ trợ bằng tiện ích trình kiểm tra

Cài đặt Tiện ích Model Context Tool Inspector để thử nghiệm với một tác nhân và xem cách các công cụ WebMCP hoạt động trong bản minh hoạ trực tiếp hoặc các ứng dụng của riêng bạn. Sử dụng câu lệnh bằng ngôn ngữ tự nhiên để xác định xem tác nhân có tương tác với các công cụ WebMCP như mong đợi hay không.

Với tiện ích này, bạn có thể:

  • Xem những công cụ nào được đăng ký trên một trang bằng cách giám sát API navigator.modelContext.
  • Gọi công cụ và thực thi các hàm theo cách thủ công.
  • Xác minh rằng bạn đã xác định đúng Cấu trúc JSON và trình duyệt có thể phân tích cú pháp dữ liệu như công cụ mong đợi.
  • Xem đầu ra có cấu trúc hoặc thông báo lỗi do công cụ của bạn trả về để đảm bảo chúng được viết rõ ràng và định dạng chính xác, nhờ đó, một nhân viên có thể hiểu được.

Nói chuyện với tác nhân bằng ngôn ngữ tự nhiên để xem tác nhân có thể xác định và gọi đúng các công cụ WebMCP thích hợp hay không. Theo mặc định, câu lệnh của bạn sẽ được gửi đến mô hình gemini-3-flash-preview.

Tương tác và chia sẻ ý kiến phản hồi

WebMCP đang được thảo luận tích cực và có thể thay đổi trong tương lai. Nếu bạn dùng thử các API này và có ý kiến phản hồi, chúng tôi rất mong được lắng nghe.