Ngày xuất bản: 18 tháng 5 năm 2026, Cập nhật lần gần đây nhất: 28 tháng 5 năm 2026
WebMCP là một tiêu chuẩn web được đề xuất để giúp bạn xây dựng và cung cấp các công cụ có cấu trúc cho các tác nhân AI agents. WebMCP cung cấp JavaScript và chú thích các phần tử biểu mẫu HTML để các tác nhân biết chính xác cách tương tác với các tính năng của trang, nhằm hỗ trợ trải nghiệm của người dùng. Điều này có thể cải thiện đáng kể hiệu suất và độ tin cậy của hoạt động kích hoạt tác nhân.
Các tác nhân AI là một công nghệ mới hơn. Các tác nhân này có thể giúp người dùng hoàn thành tốt hơn các tác vụ phức tạp và kỹ thuật cao. WebMCP mang lại độ chính xác cao hơn cho việc hoàn thành tác vụ của tác nhân và có thể được thêm dưới dạng một tính năng nâng cao từng bước.
Tại sao nên dùng WebMCP?
WebMCP có thể giúp bạn thu hẹp khoảng cách giữa các ứng dụng web và tác nhân, cải thiện hiệu quả, độ tin cậy và khả năng hoàn thành tác vụ bằng cách cung cấp các quy tắc tương tác. Thay vì để một tác nhân xem xét phần tử (chẳng hạn như một nút hoặc một trường) để hiểu mục đích của phần tử đó, trang web sẽ khai báo mục đích của phần tử để phần tử đó được sử dụng đúng cách
Điều này đáng tin cậy hơn so với hoạt động kích hoạt, có thể có nhiều bước và để mỗi bước được tác nhân diễn giải.
Các trang web có thể chia sẻ mục đích rõ ràng, chẳng hạn như tìm kiếm hoặc mua hàng, bằng cách xác định một tool. Các công cụ thực thi trên trang web của bạn một cách rõ ràng, vì vậy người dùng tin tưởng rằng các tác vụ sẽ được hoàn tất như mong đợi. Điều này cũng giúp thương hiệu và các lựa chọn thiết kế lấy con người làm trung tâm của bạn được giữ nguyên.
WebMCP hỗ trợ:
- Khám phá: Một cách tiêu chuẩn để các trang đăng ký công cụ với tác nhân, chẳng hạn như
checkouthoặcfilter_results. - Lược đồ JSON: Định nghĩa rõ ràng về dữ liệu đầu vào và đầu ra dự kiến để giảm hiện tượng ảo giác hoặc hiểu lầm.
- Trạng thái: Sự hiểu biết chung về bối cảnh trang hiện tại, để tác nhân biết những tài nguyên nào có sẵn để thực hiện theo thời gian thực.
Mục tiêu của chúng tôi là xây dựng các API mà mọi trình duyệt có khả năng tác nhân đều có thể triển khai và hưởng lợi, để người dùng có thể hoàn thành tác vụ dễ dàng hơn. Bạn có thể theo dõi quá trình này trên GitHub.
Trường hợp sử dụng
Bạn có thể sử dụng WebMCP trên web theo nhiều cách. Ví dụ:
- Giúp khách hàng được hỗ trợ. Nếu cung cấp phần mềm cho khách hàng, bạn có thể có một quy trình hỗ trợ phức tạp để giải quyết nhiều câu hỏi khác nhau. Bạn có thể sử dụng WebMCP để giúp một tác nhân nhanh chóng chuyển đến biểu mẫu phù hợp và điền các trường bằng thông tin do người dùng cung cấp.
- Cải thiện quy trình đặt vé du lịch. Giúp các tác nhân đặt các chuyến đi phức tạp, nhiều thành phố và nhiều hành khách với ít bước hơn.
Một số hành động có thể nhạy cảm, chẳng hạn như mua hàng. Bạn có thể thêm một lệnh để yêu cầu người dùng tương tác với hộp thoại xác nhận.
Về mặt thực tế, các công cụ của bạn có thể hoàn thành các tác vụ sau:
- Điền vào các biểu mẫu có cấu trúc: Xây dựng công cụ
submit_applicationđể giúp các tác nhân liên kết dữ liệu thu thập được từ cuộc trò chuyện với người dùng vào các trường biểu mẫu một cách chính xác. Ví dụ: bạn có thể phân biệt xem một trường có yêu cầu tên đầy đủ hay tên và họ riêng biệt. - Hỗ trợ các lượt tương tác của tác nhân trong giao diện ưu tiên con người: Một số trường được
thiết kế cho người dùng, nhưng có thể không được tác nhân hiểu. Bạn có thể xây dựng một công cụ
date_pickcho phép chọn ngày và giờ phức tạp trong một lượt đặt chỗ hoặc đặt sự kiện. - Gỡ lỗi ứng dụng nhanh hơn: Bạn có thể xây dựng một công cụ
run_diagnosticstrên trang cài đặt cho nhà phát triển, để một tác nhân có thể kích hoạt các bản sửa lỗi mà nếu không thì sẽ bị ẩn sau các trình đơn lồng nhau.
Bạn có thấy trường hợp sử dụng của mình không? Hoặc bạn có ý tưởng nào muốn chia sẻ về WebMCP không? Hãy tham gia chương trình xem trước sớm và chia sẻ ý kiến phản hồi của bạn.
Bắt đầu
WebMCP có sẵn dưới dạng một cờ Chrome để phát triển cục bộ. Cờ này sẽ có trong một thử nghiệm theo nguyên gốc trong Chrome 149.
Cách bật WebMCP cục bộ:
- Mở Chrome và chuyển đến
chrome://flags/#enable-webmcp-testing - Đặt cờ thành Đã bật.
- Khởi động lại Chrome để áp dụng các thay đổi.
Sử dụng API WebMCP
Bạn có thể sử dụng 2 API để thiết lập các công cụ trên trang web:
- API bắt buộc: Xác định các loại công cụ bằng JavaScript tiêu chuẩn, chẳng hạn như nhập biểu mẫu, công cụ điều hướng, quản lý trạng thái hoặc các hàm khác.
- API khai báo: Thêm chú thích vào biểu mẫu HTML tiêu chuẩn để tạo công cụ WebMCP.
Các điểm hạn chế
Mặc dù WebMCP hướng đến việc giúp các tác vụ phức tạp trở nên đơn giản hơn cho tác nhân và con người, nhưng vẫn có một số điểm hạn chế:
- Yêu cầu bối cảnh duyệt web: Vì các lệnh gọi công cụ được xử lý trong JavaScript, nên một thẻ trình duyệt hoặc một khung hiển thị web phải được mở để cung cấp giao diện và bối cảnh trình duyệt có thể nhìn thấy. Nói cách khác, không có hỗ trợ cho các tác nhân hoặc công cụ hỗ trợ để gọi các công cụ ở trạng thái không có giao diện người dùng.
- Tốn nhiều chi phí hơn cho các giao diện phức tạp: Nếu trang web của bạn rất phức tạp, thì có thể bạn cần tái cấu trúc hoặc thêm JavaScript để xử lý trạng thái ứng dụng và giao diện.
- Khả năng khám phá công cụ: Khách hàng và trình duyệt phải truy cập trực tiếp vào một trang web để biết trang web đó có các công cụ có thể gọi hay không.
Chính sách về quyền
Cả hai API đều được kiểm soát bởi tools Chính sách về quyền.
Chính sách này mặc định là self, cho phép đăng ký công cụ trong các bối cảnh cấp cao nhất và cùng nguồn gốc, đồng thời vô hiệu hoá chính sách này cho các iframe trên nhiều nguồn gốc.
Để cho phép các công cụ WebMCP trong một iframe trên nhiều nguồn gốc, hãy thêm allow="tools"
thuộc tính vào iframe.
Bản minh hoạ
Bạn có thể xem các ví dụ về bản minh hoạ bao gồm cả hoạt động triển khai bắt buộc và khai báo:
- WebMCP zaMaker sử dụng API bắt buộc của WebMCP.
- Bản minh hoạ về du lịch (React) sử dụng API bắt buộc của WebMCP.
- Bản minh hoạ Le Petit Bistro sử dụng API khai báo của WebMCP.
Bạn cũng có thể xem và khám phá mã nguồn của bản minh hoạ trên GitHub.
Mô phỏng cuộc trò chuyện của tác nhân bằng tiện ích trình kiểm tra
Cài đặt Tiện ích trình kiểm tra công cụ bối cảnh mô hình để thử nghiệm với một tác nhân và xem cách các công cụ WebMCP hoạt động trong các bản minh hoạ trực tiếp hoặc ứng dụng của riêng bạn. Sử dụng câu lệnh bằng ngôn ngữ tự nhiên để xác định xem tác nhân có tương tác với các công cụ WebMCP như mong đợi hay không.
Với tiện ích này, bạn có thể:
- Xem những công cụ nào được đăng ký trên một trang bằng cách theo dõi API WebMCP.
- Gọi công cụ và thực thi hàm theo cách thủ công.
- Xác minh rằng Lược đồ JSON của bạn được xác định chính xác và trình duyệt có thể phân tích cú pháp dữ liệu như công cụ mong đợi.
- Xem thông báo lỗi hoặc đầu ra có cấu trúc do công cụ của bạn trả về để đảm bảo rằng các thông báo này được viết rõ ràng và định dạng đúng cách, để một tác nhân có thể hiểu được.
Trò chuyện với tác nhân bằng ngôn ngữ tự nhiên để xem tác nhân có thể xác định và gọi đúng các công cụ WebMCP hay không. Theo mặc định, câu lệnh của bạn sẽ được gửi đến mô hình gemini-3-flash-preview.
Tương tác và chia sẻ ý kiến phản hồi
WebMCP đang được thảo luận tích cực và có thể thay đổi trong tương lai. Nếu bạn dùng thử các API này và có ý kiến phản hồi, chúng tôi rất mong được lắng nghe ý kiến của bạn.
- Đọc bài giải thích về WebMCP, đặt câu hỏi và tham gia thảo luận.
- Đọc các phương pháp hay nhất về WebMCP.
- Xem lại hoạt động triển khai cho Chrome trên Chrome Status.
- Tham gia chương trình xem trước sớm để xem trước các API mới và truy cập vào danh sách gửi thư của chúng tôi.
- Nếu bạn có ý kiến phản hồi về hoạt động triển khai của Chrome, hãy báo cáo lỗi Chromium.