Xuất bản: Ngày 18 tháng 5 năm 2026
WebMCP là một tiêu chuẩn web được đề xuất để giúp bạn xây dựng và hiển thị các công cụ có cấu trúc cho tác nhân AI. WebMCP cung cấp JavaScript và chú thích các phần tử biểu mẫu HTML để các tác nhân biết chính xác cách tương tác với các tính năng trên trang, nhằm hỗ trợ trải nghiệm của người dùng. Điều này có thể cải thiện đáng kể hiệu suất và độ tin cậy của quá trình kích hoạt tác nhân phần mềm.
Các tác nhân AI là một công nghệ mới hơn. Các mô hình này có thể giúp người dùng hoàn thành tốt hơn những nhiệm vụ có độ phức tạp và kỹ thuật cao. WebMCP mang lại độ chính xác cao hơn cho việc hoàn thành tác vụ tác nhân và có thể được thêm dưới dạng một cải tiến tăng dần.
Tại sao nên dùng WebMCP?
WebMCP có thể giúp bạn thu hẹp khoảng cách giữa các ứng dụng web và tác nhân phần mềm, cải thiện hiệu quả, độ tin cậy và khả năng hoàn thành nhiệm vụ bằng cách cung cấp các quy tắc tương tác. Thay vì nhân viên xem xét phần tử (chẳng hạn như nút hoặc trường) để hiểu mục đích của phần tử đó, trang web sẽ khai báo mục đích của phần tử để phần tử được sử dụng đúng cách
Điều này đáng tin cậy hơn so với hành động, có thể có nhiều bước và mỗi bước đều có thể được nhân viên diễn giải theo cách riêng.
Các trang web có thể chia sẻ mục đích rõ ràng, chẳng hạn như tìm kiếm hoặc mua hàng, bằng cách xác định một công cụ. Các công cụ này thực thi trên trang web của bạn một cách rõ ràng, vì vậy người dùng sẽ tin tưởng rằng các tác vụ được hoàn thành như mong đợi. Điều này cũng giúp bạn giữ nguyên thương hiệu và các lựa chọn thiết kế lấy con người làm trung tâm.
WebMCP hỗ trợ:
- Khám phá: Cách tiêu chuẩn để các trang đăng ký công cụ với các tác nhân, chẳng hạn như
checkouthoặcfilter_results. - Giản đồ JSON: Định nghĩa rõ ràng về dữ liệu đầu vào và đầu ra dự kiến, nhằm giảm hiện tượng ảo giác hoặc hiểu lầm.
- Trạng thái: Hiểu biết chung về bối cảnh trang hiện tại, nhờ đó, tác nhân biết những tài nguyên có sẵn để hành động theo thời gian thực.
Mục tiêu của chúng tôi là xây dựng các API mà mọi trình duyệt có khả năng của tác nhân AI đều có thể triển khai và hưởng lợi, nhờ đó người dùng của bạn có thể dễ dàng hoàn thành các tác vụ hơn. Bạn có thể theo dõi quy trình này trên GitHub.
Trường hợp sử dụng
Bạn có thể sử dụng WebMCP theo nhiều cách trên web. Ví dụ:
- Giúp khách hàng nhận được sự hỗ trợ. Nếu cung cấp phần mềm cho khách hàng, bạn có thể có một quy trình hỗ trợ phức tạp để giải quyết nhiều câu hỏi khác nhau. Bạn có thể sử dụng WebMCP để giúp nhân viên hỗ trợ nhanh chóng chuyển đến biểu mẫu phù hợp và điền thông tin do người dùng cung cấp vào các trường.
- Cải thiện quy trình đặt vé du lịch. Giúp nhân viên đặt những chuyến đi phức tạp, nhiều thành phố và nhiều hành khách chỉ trong vài bước.
Một số hành động có thể nhạy cảm, chẳng hạn như mua hàng. Bạn có thể thêm một lệnh để yêu cầu người dùng tương tác với hộp thoại xác nhận.
Trên thực tế, các công cụ của bạn có thể hoàn thành những việc sau:
- Điền vào các biểu mẫu có cấu trúc: Tạo một công cụ
submit_applicationđể giúp các nhân viên hỗ trợ liên kết chính xác dữ liệu thu thập được từ cuộc trò chuyện với người dùng vào các trường trong biểu mẫu. Ví dụ: bạn có thể phân biệt xem một trường có yêu cầu tên đầy đủ hay chỉ yêu cầu họ và tên riêng biệt. - Tương tác của nhân viên hỗ trợ trong giao diện ưu tiên người dùng: Một số trường được thiết kế cho người dùng, nhưng có thể không được nhân viên hỗ trợ hiểu. Bạn có thể tạo một công cụ
date_pickcho phép chọn ngày và giờ phức tạp trong một lượt đặt trước hoặc đặt sự kiện. - Gỡ lỗi ứng dụng nhanh hơn: Bạn có thể tạo một công cụ
run_diagnosticstrên trang cài đặt cho nhà phát triển, nhờ đó, một tác nhân có thể kích hoạt các bản sửa lỗi mà nếu không thì sẽ bị ẩn sau các trình đơn lồng nhau.
Bạn có thấy trường hợp sử dụng của mình bị thiếu không? Hoặc bạn có ý tưởng nào muốn chia sẻ cho WebMCP không? Tham gia chương trình dùng thử sớm và chia sẻ ý kiến phản hồi của bạn.
Bắt đầu
WebMCP có sẵn dưới dạng cờ Chrome để phát triển cục bộ. API này sẽ có trong bản dùng thử theo nguyên gốc trong Chrome 149.
Cách bật WebMCP cục bộ:
- Mở Chrome rồi chuyển đến
chrome://flags/#enable-webmcp-testing - Đặt trạng thái cờ thành Đã bật.
- Khởi chạy lại Chrome để áp dụng các thay đổi.
Sử dụng API WebMCP
Bạn có thể sử dụng 2 API để thiết lập các công cụ trên trang web:
- API mệnh lệnh: Xác định nhiều loại công cụ bằng JavaScript tiêu chuẩn, chẳng hạn như đầu vào biểu mẫu, công cụ điều hướng, quản lý state hoặc các hàm khác.
- API khai báo: Thêm chú thích vào các biểu mẫu HTML tiêu chuẩn để tạo một công cụ WebMCP.
Các điểm hạn chế
Mặc dù WebMCP hướng đến việc đơn giản hoá các tác vụ phức tạp cho các tác nhân và con người, nhưng vẫn có một số hạn chế:
- Yêu cầu về bối cảnh duyệt web: Vì các lệnh gọi công cụ được xử lý trong JavaScript, nên bạn phải mở một thẻ trình duyệt hoặc webview để cung cấp giao diện hiển thị và bối cảnh trình duyệt. Nói cách khác, không có sự hỗ trợ nào cho các tác nhân hoặc công cụ hỗ trợ để gọi các công cụ ở trạng thái không có giao diện người dùng.
- Tốn nhiều chi phí hơn cho các giao diện phức tạp: Nếu trang web của bạn rất phức tạp, thì có thể bạn cần cải tiến hoặc thêm JavaScript để xử lý state ứng dụng và giao diện.
- Khả năng khám phá công cụ: Ứng dụng và trình duyệt phải truy cập trực tiếp vào một trang web để biết trang web đó có các công cụ có thể gọi hay không.
Bản minh hoạ
Bạn có thể xem các ví dụ về bản minh hoạ bao gồm cả việc triển khai bắt buộc và khai báo:
- WebMCP zaMaker sử dụng WebMCP Imperative API.
- Bản minh hoạ về du lịch (React) sử dụng WebMCP Imperative API.
- Bản demo Le Petit Bistro sử dụng WebMCP Declarative API.
Bạn cũng có thể xem xét và khám phá mã nguồn của bản minh hoạ trên GitHub.
Mô phỏng cuộc trò chuyện với nhân viên hỗ trợ bằng tiện ích trình kiểm tra
Cài đặt Tiện ích Model Context Tool Inspector để thử nghiệm với một tác nhân và xem cách các công cụ WebMCP hoạt động trong bản minh hoạ trực tiếp hoặc trong các ứng dụng của riêng bạn. Bạn có thể nhập câu lệnh bằng ngôn ngữ tự nhiên để xem liệu một tác nhân có thể tương tác chính xác với các công cụ WebMCP hay không.
Với tiện ích này, bạn có thể:
- Xem những công cụ nào được đăng ký trên một trang bằng cách giám sát API
navigator.modelContext. - Gọi công cụ và thực thi các hàm theo cách thủ công.
- Xác minh rằng bạn đã xác định đúng Cấu trúc JSON và trình duyệt có thể phân tích cú pháp dữ liệu như công cụ mong đợi.
- Xem đầu ra có cấu trúc hoặc thông báo lỗi do công cụ của bạn trả về để đảm bảo chúng được viết rõ ràng và định dạng chính xác, nhờ đó, một nhân viên có thể hiểu được.
Nói chuyện với tác nhân bằng ngôn ngữ tự nhiên để xem tác nhân có thể xác định và gọi đúng các công cụ WebMCP thích hợp hay không. Câu lệnh của bạn được gửi đến mô hình gemini-2.5-flash.
Tương tác và chia sẻ ý kiến phản hồi
WebMCP đang được thảo luận tích cực và có thể thay đổi trong tương lai. Nếu bạn dùng thử các API này và có ý kiến phản hồi, chúng tôi rất mong được lắng nghe.
- Đọc tài liệu giải thích về WebMCP, đặt câu hỏi và tham gia thảo luận.
- Đọc các phương pháp hay nhất về WebMCP.
- Xem xét việc triển khai cho Chrome trên Trạng thái của Chrome.
- Tham gia chương trình xem trước sớm để xem trước các API mới và truy cập vào danh sách gửi thư của chúng tôi.
- Nếu bạn muốn phản hồi về cách Chrome triển khai tính năng này, hãy báo cáo lỗi Chromium.