เผยแพร่: 18 พฤษภาคม 2026, อัปเดตล่าสุด: 9 มิถุนายน 2026
WebMCP เป็นมาตรฐานเว็บที่เสนอเพื่อช่วยคุณสร้างและเปิดเผยเครื่องมือที่มีโครงสร้างสำหรับเอเจนต์ AI WebMCP มี JavaScript และ อธิบายประกอบองค์ประกอบแบบฟอร์ม HTML เพื่อให้ Agent ทราบวิธีโต้ตอบกับ ฟีเจอร์ของหน้าเว็บอย่างถูกต้องเพื่อรองรับประสบการณ์ของผู้ใช้ ซึ่งจะช่วยปรับปรุง ประสิทธิภาพและความน่าเชื่อถือของการกระทำของเอเจนต์ได้อย่างมาก
เอเจนต์ AI เป็นเทคโนโลยีที่ใหม่กว่า ซึ่งจะช่วยให้ผู้ใช้ที่เป็นมนุษย์ทำงานที่ซับซ้อนและต้องใช้ความรู้ทางเทคนิคให้เสร็จสมบูรณ์ได้ดียิ่งขึ้น WebMCP มีความแม่นยำสูงกว่าสำหรับการทำงานที่ต้องใช้เอเจนต์ และสามารถเพิ่มเป็นการเพิ่มประสิทธิภาพแบบต่อเนื่องได้
| วิดีโออธิบาย | เว็บ | ส่วนขยาย | สถานะของ Chrome | ความตั้งใจ |
|---|---|---|---|---|
| GitHub | ดู | ความตั้งใจที่จะทดลอง |
ทำไมจึงควรเลือกใช้ WebMCP
WebMCP ช่วยให้คุณเชื่อมช่องว่างระหว่างเว็บแอปพลิเคชันกับเอเจนต์ เพื่อเพิ่มประสิทธิภาพ ความน่าเชื่อถือ และการทำงานให้เสร็จสมบูรณ์ โดยการกำหนดกฎสำหรับการโต้ตอบ แทนที่จะให้ตัวแทนตรวจสอบองค์ประกอบ เช่น ปุ่มหรือฟิลด์ เพื่อทำความเข้าใจวัตถุประสงค์ขององค์ประกอบนั้น เว็บไซต์จะประกาศวัตถุประสงค์ขององค์ประกอบ เพื่อให้มีการใช้งานอย่างถูกต้อง
ซึ่งมีความน่าเชื่อถือมากกว่าการกระตุ้นที่อาจมีหลายขั้นตอนและปล่อยให้ Agent ตีความแต่ละขั้นตอน
เว็บไซต์สามารถแชร์วัตถุประสงค์ที่ชัดเจน เช่น การค้นหาหรือการซื้อ โดยการกำหนดtool เครื่องมือจะทำงานในหน้าเว็บอย่างชัดเจนเพื่อให้ผู้ใช้มั่นใจ
ว่าระบบจะทำงานให้เสร็จตามที่คาดไว้ นอกจากนี้ยังช่วยรักษาตัวเลือกการออกแบบที่คำนึงถึงแบรนด์และ
มนุษย์ไว้ด้วย
WebMCP รองรับการดำเนินการต่อไปนี้
- การค้นพบ: วิธีมาตรฐานสำหรับหน้าที่ใช้ลงทะเบียนเครื่องมือกับ Agent เช่น
checkoutหรือfilter_results - สคีมา JSON: คำจำกัดความที่ชัดเจนของอินพุตและเอาต์พุตที่คาดไว้ เพื่อลดการหลอนหรือความเข้าใจผิด
- สถานะ: ความเข้าใจร่วมกันเกี่ยวกับบริบทของหน้าเว็บปัจจุบัน เพื่อให้ตัวแทนทราบว่ามีทรัพยากรอะไรบ้างที่พร้อมใช้งานแบบเรียลไทม์
เป้าหมายของเราคือการสร้าง API ที่เบราว์เซอร์ใดก็ตามที่มีความสามารถแบบเอเจนต์สามารถ นำไปใช้และรับประโยชน์ได้ เพื่อให้ผู้ใช้ทำงานต่างๆ ได้ง่ายขึ้น คุณ สามารถติดตามกระบวนการนี้ได้ที่ GitHub
กรณีการใช้งาน
คุณใช้ WebMCP บนเว็บได้หลายวิธี เช่น
- ช่วยให้ลูกค้าได้รับการสนับสนุน หากคุณให้บริการซอฟต์แวร์แก่ลูกค้า คุณอาจมีขั้นตอนการสนับสนุนที่ซับซ้อนเพื่อตอบคำถามที่แตกต่างกันมากมาย คุณสามารถใช้ WebMCP เพื่อช่วยให้ตัวแทนไปยังแบบฟอร์มที่ถูกต้องและกรอกข้อมูลในช่องต่างๆ ด้วยข้อมูลที่ผู้ใช้ระบุได้เร็วขึ้น
- ปรับปรุงการจองการเดินทาง ช่วยให้ตัวแทนจำหน่ายจองการเดินทางที่ซับซ้อน หลายเมือง และหลายผู้โดยสารได้ในไม่กี่ขั้นตอน
การดำเนินการบางอย่างอาจมีความละเอียดอ่อน เช่น การซื้อ คุณสามารถใส่ คำสั่งเพื่อขอให้ผู้ใช้โต้ตอบกับกล่องโต้ตอบการยืนยันได้
ในทางปฏิบัติ เครื่องมือของคุณสามารถทำงานต่อไปนี้ได้
- กรอกแบบฟอร์มที่มีโครงสร้าง: สร้าง
submit_applicationเครื่องมือเพื่อช่วยให้ตัวแทนแมปข้อมูลที่รวบรวมจากการสนทนากับผู้ใช้ไปยังช่องแบบฟอร์มได้อย่างถูกต้อง ตัวอย่างเช่น คุณสามารถแยกความแตกต่างได้ว่าช่องต้องใช้ชื่อเต็มหรือชื่อและนามสกุลแยกกัน - การโต้ตอบของตัวแทนฝ่ายสนับสนุนในอินเทอร์เฟซที่เน้นมนุษย์เป็นอันดับแรก: ฟิลด์บางรายการออกแบบมาสำหรับผู้ใช้ที่เป็นมนุษย์ แต่ตัวแทนอาจไม่เข้าใจ คุณสามารถสร้าง
date_pickเครื่องมือที่ช่วยให้เลือกวันที่และเวลาที่ซับซ้อนในการจองหรือการจองกิจกรรมได้ - การแก้ไขข้อบกพร่องของแอปพลิเคชันได้เร็วขึ้น: คุณสามารถสร้างเครื่องมือ
run_diagnosticsในหน้าการตั้งค่าสำหรับนักพัฒนาแอป เพื่อให้ตัวแทนสามารถเรียกใช้การแก้ไขที่ซ่อนอยู่หลังเมนูที่ซ้อนกัน
หากไม่เห็น Use Case ของคุณ หรือคุณมีไอเดียที่อยากแชร์สำหรับ WebMCP ไหม เข้าร่วมโปรแกรมทดลองใช้เวอร์ชันเริ่มต้น และแชร์ความคิดเห็นของคุณ
เริ่มต้นใช้งาน
เข้าร่วมช่วงทดลองใช้จากต้นทางของ WebMCP จาก Chrome 149 ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธี เริ่มต้นใช้งานช่วงทดลองใช้ฟีเจอร์ต้นทาง
WebMCP ในเครื่อง
WebMCP พร้อมใช้งานเป็น Chrome Flag สำหรับการพัฒนาในเครื่อง
- เปิด Chrome แล้วไปที่
chrome://flags/#enable-webmcp-testing - ตั้งค่า Flag เป็นเปิดใช้
- เปิด Chrome อีกครั้งเพื่อใช้การเปลี่ยนแปลง
ใช้ WebMCP API
คุณใช้ API ได้ 2 รายการเพื่อตั้งค่าเครื่องมือเว็บไซต์ ดังนี้
- Imperative API: กำหนดเครื่องมือประเภทต่างๆ ด้วย JavaScript มาตรฐาน เช่น อินพุตแบบฟอร์ม เครื่องมือนำทาง การจัดการสถานะ หรือฟังก์ชันอื่นๆ
- Declarative API: เพิ่มหมายเหตุลงในแบบฟอร์ม HTML มาตรฐาน เพื่อสร้างเครื่องมือ WebMCP
ข้อจำกัด
แม้ว่า WebMCP จะมีจุดมุ่งหมายเพื่อลดความซับซ้อนของงานที่ซับซ้อนสำหรับตัวแทนและมนุษย์ แต่ก็มีข้อจำกัดบางประการ ดังนี้
- ต้องมีบริบทการเรียกดู: เนื่องจากมีการจัดการการเรียกใช้เครื่องมือใน JavaScript จึงต้องเปิดแท็บเบราว์เซอร์หรือ WebView เพื่อแสดงอินเทอร์เฟซที่มองเห็นได้และ บริบทของเบราว์เซอร์ กล่าวคือ ไม่มีบริการสนับสนุนสำหรับเอเจนต์หรือเครื่องมือช่วยเหลือ ในการเรียกเครื่องมือในสถานะแบบไม่มีส่วนหัว
- ค่าใช้จ่ายที่สูงขึ้นสำหรับอินเทอร์เฟซที่ซับซ้อน: หากเว็บไซต์มีความซับซ้อนสูง คุณอาจต้องปรับโครงสร้างใหม่หรือเพิ่ม JavaScript เพื่อจัดการสถานะของแอปพลิเคชันและอินเทอร์เฟซ
- การค้นพบเครื่องมือ: ไคลเอ็นต์และเบราว์เซอร์ต้องเข้าชมเว็บไซต์โดยตรงเพื่อ ดูว่าเว็บไซต์มีเครื่องมือที่เรียกใช้ได้หรือไม่
ความปลอดภัยและสิทธิ์
API ของ WebMCP จะได้รับการควบคุมโดยทั้งข้อกำหนดการแยกต้นทางและนโยบายสิทธิ์
การแยกต้นทาง
WebMCP ใช้ได้เฉพาะในเอกสารที่แยกต้นทาง เท่านั้น ซึ่งช่วยให้มั่นใจว่าแหล่งที่มาของเอกสารจะยังคงเดิมตลอดอายุการใช้งานของเครื่องมือ
หากเอกสารมี document.domain เปิดใช้ (เช่น โดยใช้ส่วนหัว HTTP
Origin-Agent-Cluster: ?0) ระบบจะปิดใช้ WebMCP API
นโยบายสิทธิ์
ทั้ง 2 API จะได้รับการควบคุมโดยtools
นโยบายสิทธิ์
นโยบายนี้มีค่าเริ่มต้นเป็น self ซึ่งอนุญาตให้ลงทะเบียนเครื่องมือในบริบทระดับบนสุดและบริบทที่มีต้นทางเดียวกัน และปิดใช้สำหรับ iframe แบบข้ามต้นทาง
หากต้องการอนุญาตเครื่องมือ WebMCP ใน iframe แบบข้ามต้นทาง ให้เพิ่มแอตทริบิวต์ allow="tools"
ลงใน iframe
สาธิต
ตัวอย่างการสาธิตที่ครอบคลุมทั้งการติดตั้งใช้งานแบบคำสั่งและแบบประกาศมีดังนี้
- WebMCP zaMaker ใช้ WebMCP Imperative API
- การสาธิตการเดินทาง (React) ใช้ WebMCP Imperative API
- การสาธิต Le Petit Bistro ใช้ Declarative API ของ WebMCP
นอกจากนี้ คุณยังตรวจสอบและสำรวจซอร์สโค้ดของเดโมได้ใน GitHub
จำลองการแชทกับตัวแทนด้วยส่วนขยายเครื่องมือตรวจสอบ
ติดตั้งส่วนขยายเครื่องมือตรวจสอบบริบทของโมเดล เพื่อทดลองใช้เอเจนต์และดูว่าเครื่องมือ WebMCP ทำงานอย่างไรในการสาธิตแบบเรียลไทม์หรือในแอปพลิเคชันของคุณเอง ใช้พรอมต์ภาษาธรรมชาติเพื่อพิจารณาว่าเอเจนต์โต้ตอบกับเครื่องมือ WebMCP ตามที่คาดไว้หรือไม่
ส่วนขยายนี้ช่วยให้คุณทำสิ่งต่อไปนี้ได้
- ดูว่าเครื่องมือใดลงทะเบียนไว้ในหน้าเว็บโดยการตรวจสอบ WebMCP API
- เรียกใช้เครื่องมือและฟังก์ชันด้วยตนเอง
- ตรวจสอบว่าได้กำหนดสคีมา JSON อย่างถูกต้องและเบราว์เซอร์สามารถแยกวิเคราะห์ ข้อมูลตามที่เครื่องมือคาดหวัง
- ดูเอาต์พุตที่มีโครงสร้างหรือข้อความแสดงข้อผิดพลาดที่เครื่องมือส่งคืนเพื่อให้แน่ใจว่า เขียนอย่างชัดเจนและจัดรูปแบบอย่างถูกต้อง เพื่อให้ตัวแทนเข้าใจได้
พูดคุยกับเอเจนต์โดยใช้ภาษาธรรมชาติเพื่อดูว่าเอเจนต์ระบุและเรียกใช้เครื่องมือ WebMCP ที่เหมาะสมได้อย่างถูกต้องหรือไม่
ระบบจะส่งพรอมต์ของคุณไปยังโมเดล gemini-3-flash-preview โดยค่าเริ่มต้น
มีส่วนร่วมและแชร์ความคิดเห็น
WebMCP อยู่ระหว่างการหารืออย่างต่อเนื่องและอาจมีการเปลี่ยนแปลงในอนาคต หากคุณลองใช้ API เหล่านี้และมีความคิดเห็น เรายินดีรับฟัง
- อ่านคำอธิบายของ WebMCP ถามคำถามและเข้าร่วมการสนทนา
- เข้าร่วมช่วงทดลองใช้จากต้นทาง WebMCP
- อ่านแนวทางปฏิบัติแนะนำสำหรับ WebMCP
- ดูการติดตั้งใช้งานสำหรับ Chrome ได้ที่ Chrome Status
- อ่านคำแนะนำด้านความปลอดภัยของเครื่องมือ WebMCP และแนวทางปฏิบัติแนะนำ
- เข้าร่วมโปรแกรมตัวอย่างก่อนเปิดตัว เพื่อดู API ใหม่ๆ ก่อนใครและรับสิทธิ์เข้าถึงรายชื่ออีเมลของเรา
- หากมีความคิดเห็นเกี่ยวกับการติดตั้งใช้งานของ Chrome โปรดรายงานข้อบกพร่องของ Chromium