เผยแพร่: 11 มีนาคม 2026
เมื่อเดือนกุมภาพันธ์ เราได้ประกาศว่า WebMCP พร้อมให้ใช้งานในโปรแกรม ตัวอย่างเวอร์ชันแรกแล้ว เมื่อเอเจนต์ AI เป็นที่นิยมมากขึ้นในเบราว์เซอร์ เราได้ยินนักพัฒนาเว็บถามคำถามนี้ "WebMCP จะมาแทนที่ Model Context Protocol (MCP) ไหม"
แม้ว่าฉันจะเข้าใจว่าทำไมคุณถึงถามคำถามนี้ แต่คำถามนี้เกิดจากความเข้าใจผิด คุณไม่จำเป็นต้องเลือกระหว่าง MCP กับ WebMCP เพื่อสร้าง ประสบการณ์การทำงานแบบเอเจนต์ WebMCP ไม่ใช่ส่วนขยายหรือสิ่งทดแทน MCP แต่ WebMCP และ MCP ตอบโจทย์ความต้องการที่แตกต่างกัน WebMCP ช่วยให้คุณชี้แจงวัตถุประสงค์ของ ฟีเจอร์แอปพลิเคชันและมอบความสามารถเพิ่มเติมให้กับตัวแทนเบราว์เซอร์เพื่อ โต้ตอบกับเว็บไซต์ของคุณ
ตัวอย่างที่เห็นภาพได้ชัดคือความแตกต่างระหว่างคอลเซ็นเตอร์ฝ่ายบริการลูกค้าของบริษัทกับผู้เชี่ยวชาญในร้านค้า
- MCP พร้อมให้บริการบนทุกแพลตฟอร์มทุกเมื่อ โดยสามารถดึงข้อมูลและจัดการ งานหลักได้ตามต้องการ
- WebMCP ใช้ได้บนเว็บไซต์ของคุณเท่านั้น โดยปกติแล้วเว็บไซต์จะเป็นอินเทอร์เฟซผู้ใช้ (UI) ที่ออกแบบมาสำหรับมนุษย์ ไม่ใช่เครื่องจักร WebMCP ช่วยให้ตัวแทนเข้าใจ UI ได้ดียิ่งขึ้น
ซึ่งจะช่วยให้เอเจนต์ทำงานที่ปรับเปลี่ยนในแบบของคุณในนามของผู้ใช้ที่เป็นมนุษย์ได้
ฟังก์ชันและวัตถุประสงค์
เทคโนโลยีทั้ง 2 อย่างมีปรัชญาเดียวกัน นั่นคือการสร้างวิธีที่ได้มาตรฐานและ เชื่อถือได้สำหรับแอปพลิเคชันในการแสดงเครื่องมือของตนต่อ AI Agent
ในทางปฏิบัติ การดำเนินการนี้รวมถึงสิ่งต่อไปนี้
- การค้นพบเครื่องมือที่มีโครงสร้าง: เครื่องมือเหล่านี้มีวิธีที่เครื่องอ่านได้สำหรับเอเจนต์ในการถามว่า "คุณทำอะไรได้บ้าง" และรับรายการเครื่องมือที่มีอยู่ พารามิเตอร์ และวัตถุประสงค์ของเครื่องมืออย่างชัดเจน
- การดำเนินการที่คาดการณ์ได้: ฟังก์ชันเหล่านี้จะแทนที่การคาดเดาด้วยการเรียกฟังก์ชันที่ชัดเจน Agent จะเรียกใช้เครื่องมือที่กำหนด ซึ่งจะทำให้ได้ผลลัพธ์ที่คาดการณ์ได้ ต่างจากการจำลองรูปแบบการคลิกที่อาจเปลี่ยนแปลง
- เจตนาที่ชัดเจน: ประกาศความสามารถอย่างชัดเจน หากไม่มี WebMCP และ MCP เจ้าหน้าที่จะคาดเดาการดำเนินการที่ต้องทำโดยอิงตามความเข้าใจใน UI WebMCP และ MCP ช่วยให้ตัวแทนทราบได้อย่างแน่นอนว่าฟีเจอร์หนึ่งๆ ควรทำงานอย่างไร โดยไม่ต้องอนุมานการดำเนินการจากองค์ประกอบ UI
ความแตกต่างที่สำคัญระหว่างทั้ง 2 อย่างคือตำแหน่งที่ฟังก์ชันการทำงานของแอปพลิเคชันอยู่
MCP ใช้สำหรับแบ็กเอนด์
Model Context Protocol (MCP) เป็นมาตรฐานที่เชื่อมต่อ AI Agent (ไม่ว่าจะใช้เบราว์เซอร์หรือไม่ก็ตาม) กับ ระบบภายนอก ซึ่งรวมถึงแหล่งข้อมูล เครื่องมือ และเวิร์กโฟลว์ โปรโตคอลนี้เป็นโปรโตคอล สากล มักใช้ JSON-RPC และมีการติดตั้งใช้งาน ผ่าน SDK เฉพาะภาษา เช่น Rust, Python และ TypeScript
WebMCP มีไว้สำหรับส่วนหน้า
WebMCP เป็นมาตรฐานเบราว์เซอร์ที่เสนอโดยมี API 2 รายการที่โต้ตอบกับเอเจนต์ในตัวของเบราว์เซอร์โดยเฉพาะ คุณสามารถใช้ API เหล่านี้กับแอตทริบิวต์ JavaScript หรือ HTML ได้ เบราว์เซอร์ทำหน้าที่เป็นตัวกลางในการสื่อสารระหว่างเว็บไซต์กับเอเจนต์
โปรดพิจารณาว่า WebMCP เป็นชุด API ที่ "ได้รับแรงบันดาลใจจาก MCP" แทนที่จะเป็นการติดตั้งใช้งาน MCP โดยตรงใน JavaScript WebMCP สร้างขึ้นเพื่อเบราว์เซอร์โดยเฉพาะและละเว้น แนวคิดฝั่งเซิร์ฟเวอร์ต่างๆ เช่น ทรัพยากร
ควบคุมวิธีที่ตัวแทนเข้าถึงเว็บไซต์ของคุณ
WebMCP ช่วยให้คุณควบคุมวิธีที่ตัวแทนโต้ตอบกับเว็บไซต์ได้ ซึ่งมีข้อดีหลักๆ หลายประการ ดังนี้
- ความเร็วและความน่าเชื่อถือ: เนื่องจาก WebMCP ใช้ระบบภายในของเบราว์เซอร์ การสื่อสารระหว่างไคลเอ็นต์กับเครื่องมือจึงเกิดขึ้นในทันที คุณไม่จำเป็นต้องรอการเดินทางไปกลับไปยังเซิร์ฟเวอร์ระยะไกล
- สร้างมาเพื่อใช้งานได้ยาวนาน: เครื่องมือ WebMCP เชื่อมต่อกับตรรกะของแอปพลิเคชัน ไม่ใช่การออกแบบ ซึ่งหมายความว่าคุณสามารถออกแบบเว็บไซต์ใหม่ได้โดยไม่กระทบต่อความสามารถของเอเจนต์ในการโต้ตอบกับเว็บไซต์อย่างถูกต้อง
- คุณควบคุมได้: คุณกำหนดวิธีที่ต้องการให้ตัวแทน โต้ตอบกับเว็บไซต์อย่างชัดเจน แทนที่จะหวังว่าตัวแทนจะพบปุ่มที่เหมาะสม เพื่อคลิก คุณกำหนดตรรกะของแอปพลิเคชันในลักษณะที่เอเจนต์เข้าใจได้ โดยแนะนำเอเจนต์โดยตรงแทนที่จะหวังว่าเอเจนต์จะอนุมานการดำเนินการจาก UI
ควบคุมการเข้าถึง UI
หากต้องการทำความเข้าใจความแตกต่าง ให้พิจารณาว่า "ใครเป็นเจ้าของ UI" แอป MCP จะแสดง UI ของแอปพลิเคชันภายใน UI ของตัวแทน อินเทอร์เฟซของคุณต้องเป็นไปตามข้อจำกัดเหล่านี้ และต้องมีการสมัครใหม่แยกต่างหาก
WebMCP ช่วยให้ตัวแทนโต้ตอบกับเว็บไซต์ที่มีอยู่แบบเรียลไทม์ โดยสามารถ เข้าถึงข้อมูลเซสชันสด คุกกี้ และองค์ประกอบ DOM ที่ใช้ได้เฉพาะ ในแท็บเบราว์เซอร์ที่ใช้งานอยู่ แทนที่แอปพลิเคชันของคุณจะเป็นผู้มาเยือน ภายในเอเจนต์ เอเจนต์จะเป็นผู้มาเยือนในแพลตฟอร์มของคุณ
ที่สำคัญคือเครื่องมือ WebMCP จะมีอายุการใช้งานชั่วคราว โดยจะปรากฏเฉพาะเมื่อหน้าเว็บเปิดอยู่เท่านั้น เมื่อผู้ใช้ออกจากเว็บไซต์หรือปิดแท็บแล้ว ตัวแทน จะเข้าถึงเว็บไซต์หรือดำเนินการใดๆ ไม่ได้อีก
ใช้ WebMCP และ MCP
เมื่อเลือกโซลูชันที่เหมาะสมสำหรับฟีเจอร์หรือฟังก์ชันที่เฉพาะเจาะจง ให้พิจารณา บริบทและความพร้อมใช้งาน
| MCP | WebMCP | |
|---|---|---|
| Purpose | ทำให้ตัวแทนเข้าถึงข้อมูลและการดำเนินการได้ทุกที่ทุกเวลา | ทำให้เว็บไซต์ที่ใช้งานจริงพร้อมสำหรับการโต้ตอบกับตัวแทนได้ทันทีเมื่อผู้ใช้เข้าชมเว็บไซต์ |
| วงจร | ต่อเนื่อง (เซิร์ฟเวอร์และ Daemon) | ชั่วคราว (เชื่อมโยงกับแท็บ) |
| การเชื่อมต่อ | ทั่วโลก (เดสก์ท็อป, อุปกรณ์เคลื่อนที่, คลาวด์, เว็บ) | เฉพาะสภาพแวดล้อม (ตัวแทนเบราว์เซอร์) |
| การโต้ตอบกับ UI | ไม่มีส่วนหัวและภายนอก | ผสานรวมกับเบราว์เซอร์และรับรู้ DOM |
| Discovery | ขั้นตอนการลงทะเบียนเฉพาะตัวแทน | เครื่องมือที่ลงทะเบียนในหน้าเว็บระหว่างที่ผู้ใช้เข้าชม |
| Use Case | ดำเนินการ API ในเบื้องหลัง | ไปยัง UI ของเว็บที่ใช้งานจริงและสั่งการ |
แอปพลิเคชันแบบเอเจนต์ที่มีประสิทธิภาพมากที่สุดจะใช้ทั้ง MCP และ WebMCP เพื่อใช้ประโยชน์จาก จุดแข็งของทั้ง 2 เทคโนโลยี
- จัดการตรรกะหลักด้วย MCP: เซิร์ฟเวอร์ MCP ทำหน้าที่เป็นเลเยอร์บริการพื้นฐาน โดยจะจัดการตรรกะทางธุรกิจหลัก การดึงข้อมูล และ งานที่ทำอยู่เบื้องหลัง ซึ่งจะช่วยให้มั่นใจได้ว่าบริการของคุณจะใช้ได้กับทุกแพลตฟอร์มและพร้อมให้บริการแก่ตัวแทนเสมอ
- สร้าง UI ตามบริบทด้วย WebMCP: WebMCP เป็นขั้นตอนสุดท้าย ซึ่งเป็นการเชื่อมต่อ สำหรับเอเจนต์กับเว็บไซต์โดยตรง ออกแบบมาเพื่อการโต้ตอบตามบริบทในเบราว์เซอร์ ซึ่งช่วยให้ตัวแทนดำเนินการในนามของผู้ใช้ได้อย่างรวดเร็วและเชื่อถือได้ในขณะที่ผู้ใช้เปิดเว็บไซต์ของคุณ
พิจารณาว่า MCP และ WebMCP เป็นพาร์ทเนอร์ ไม่ใช่คู่แข่ง WebMCP เป็นวิธีที่มีความเที่ยงตรงสูงสำหรับเอเจนต์ AI ที่ทำงานบนเบราว์เซอร์ในการโต้ตอบกับโลกที่เฉพาะเจาะจงซึ่งผู้ใช้เห็นในแท็บ
ขั้นตอนต่อไปคืออะไร
พร้อมที่จะทำให้เว็บไซต์ของคุณพร้อมสำหรับตัวแทนแล้วใช่ไหม คุณเริ่มทดสอบ WebMCP ได้แล้ววันนี้โดยเข้าร่วมโปรแกรมทดลองใช้ก่อนเปิดตัว
ความคิดเห็นของคุณเป็นสิ่งสำคัญที่จะช่วยกำหนดอนาคตของมาตรฐานนี้