چه زمانی از WebMCP و MCP استفاده کنیم؟

منتشر شده: ۱۱ مارس ۲۰۲۶

در ماه فوریه، ما اعلام کردیم که WebMCP برای برنامه پیش‌نمایش اولیه در دسترس است . با رایج‌تر شدن عامل‌های هوش مصنوعی در مرورگرها، از توسعه‌دهندگان وب این سوال را شنیده‌ایم: "آیا WebMCP جایگزین پروتکل زمینه مدل (MCP) خواهد شد؟"

اگرچه می‌توانم دلیل پرسیدن این سوال را درک کنم، اما این سوال بر اساس یک سوءتفاهم مطرح شده است. برای ایجاد یک تجربه کاربری، لازم نیست بین MCP و WebMCP یکی را انتخاب کنید. WebMCP یک افزونه یا جایگزین MCP نیست. در عوض، WebMCP و MCP نیازهای متفاوتی را برطرف می‌کنند. WebMCP به شما امکان می‌دهد هدف از ویژگی‌های برنامه را روشن کنید و یک مرورگر با قابلیت‌های اضافی برای تعامل با وب‌سایت خود فراهم کنید.

یک قیاس خوب، تفاوت بین مرکز تماس خدمات مشتریان یک شرکت و یک کارشناس در فروشگاه است.

  • MCP در هر پلتفرمی و در هر زمانی در دسترس است. می‌تواند داده‌ها را جمع‌آوری کرده و وظایف اصلی را در صورت نیاز انجام دهد.
  • WebMCP فقط در وب‌سایت شما موجود است. وب‌سایت‌ها معمولاً رابط‌های کاربری (UI) هستند که برای انسان‌ها طراحی شده‌اند، نه ماشین‌ها. WebMCP به کارشناسان کمک می‌کند تا رابط کاربری را بهتر درک کنند.

آنها در کنار هم، به نمایندگان کمک می‌کنند تا وظایف شخصی‌سازی‌شده را به نمایندگی از کاربران انسانی انجام دهند.

توابع و هدف

هر دو فناوری فلسفه یکسانی دارند: ایجاد روشی استاندارد و قابل اعتماد برای برنامه‌ها تا ابزارهای خود را در اختیار عوامل هوش مصنوعی قرار دهند.

در عمل، این شامل موارد زیر است:

  • کشف ساختاریافته‌ی ابزار: آن‌ها روشی قابل خواندن توسط ماشین را برای یک عامل فراهم می‌کنند تا بپرسد «چه کاری می‌توانید انجام دهید؟» و فهرستی واضح از ابزارهای موجود، پارامترهای آن‌ها و هدفشان را دریافت کند.
  • اجرای قابل پیش‌بینی: آنها حدس و گمان را با فراخوانی‌های صریح تابع جایگزین می‌کنند. یک عامل، یک ابزار تعریف‌شده را فراخوانی می‌کند. این امر منجر به یک نتیجه قابل پیش‌بینی می‌شود، برخلاف شبیه‌سازی یک الگوی کلیک که ممکن است تغییر کند.
  • هدف واضح: آنها به صراحت قابلیت‌ها را اعلام می‌کنند. بدون WebMCP و MCP، عامل‌ها بر اساس درک رابط کاربری حدس می‌زنند که چه اقدامی باید انجام دهند. با WebMCP و MCP، عامل‌ها می‌توانند با اطمینان بدانند که یک ویژگی مشخص چگونه باید کار کند، بدون اینکه نیازی به استنباط اقدامات از عناصر رابط کاربری داشته باشند.

تفاوت کلیدی بین آنها در جایی است که عملکرد برنامه قرار دارد.

MCP برای بک‌اند است

پروتکل زمینه مدل (MCP) استانداردی است که عامل‌های هوش مصنوعی (چه مبتنی بر مرورگر باشند و چه نباشند) را به سیستم‌های خارجی، از جمله منابع داده، ابزارها و گردش‌های کاری، متصل می‌کند. این پروتکل جهانی است، اغلب از JSON-RPC استفاده می‌کند و از طریق SDKهای مخصوص زبان‌های مختلف، مانند Rust، Python و TypeScript، پیاده‌سازی می‌شود.

WebMCP برای رابط کاربری است

WebMCP یک استاندارد مرورگر پیشنهادی با دو API است که منحصراً با عامل داخلی مرورگر تعامل دارند. می‌توانید این APIها را با ویژگی‌های جاوا اسکریپت یا HTML پیاده‌سازی کنید. مرورگر به عنوان رابط بین وب‌سایت شما و عامل عمل می‌کند.

WebMCP را مجموعه‌ای از APIهای «الهام‌گرفته از MCP» در نظر بگیرید، نه یک پیاده‌سازی مستقیم جاوااسکریپت از MCP. WebMCP به طور خاص برای مرورگر ساخته شده است و مفاهیم مختلف سمت سرور، مانند منابع را حذف می‌کند.

نحوه دسترسی نمایندگان به وب‌سایت خود را کنترل کنید

WebMCP به شما امکان می‌دهد نحوه تعامل نمایندگان با وب‌سایت خود را کنترل کنید. این چندین مزیت کلیدی دارد:

  • سرعت و قابلیت اطمینان: از آنجا که WebMCP از سیستم‌های داخلی مرورگر استفاده می‌کند، ارتباط بین کلاینت و ابزار تقریباً فوری است. لازم نیست منتظر یک سفر رفت و برگشت به یک سرور از راه دور باشید.
  • ساخته شده برای ماندگاری: ابزارهای WebMCP به منطق برنامه متصل می‌شوند، نه به طراحی. این بدان معناست که می‌توانید وب‌سایت خود را بدون ایجاد اختلال در توانایی یک عامل برای تعامل صحیح با آن، دوباره طراحی کنید.
  • شما کنترل را در دست دارید: شما به وضوح روش ترجیحی تعامل یک عامل با سایت خود را تعریف می‌کنید، به جای اینکه امیدوار باشید عامل دکمه مناسب را برای کلیک پیدا کند. شما منطق برنامه خود را به روشی که عامل بتواند بفهمد تعریف می‌کنید و آنها را مستقیماً راهنمایی می‌کنید، به جای اینکه امیدوار باشید که آنها از رابط کاربری (UI) اقداماتی را استنباط کنند.

کنترل دسترسی رابط کاربری

برای درک تفاوت، در نظر بگیرید که «چه کسی مالک رابط کاربری است؟» برنامه‌های MCP رابط کاربری برنامه شما را درون رابط کاربری عامل‌ها رندر می‌کنند. رابط کاربری شما باید با این محدودیت‌ها مطابقت داشته باشد و به یک برنامه جدید و جداگانه نیاز دارد.

WebMCP به عامل‌ها کمک می‌کند تا به صورت بلادرنگ با وب‌سایت موجود شما تعامل داشته باشند. این ابزار می‌تواند به داده‌های جلسه زنده، کوکی‌ها و عناصر DOM که فقط در یک تب مرورگر زنده در دسترس هستند، دسترسی داشته باشد. به جای اینکه برنامه شما مهمان یک عامل باشد، عامل مهمان پلتفرم شما خواهد بود.

نکته مهم این است که ابزارهای WebMCP زودگذر هستند. آنها فقط زمانی وجود دارند که صفحه شما باز باشد. به محض اینکه کاربر از سایت شما خارج شود یا تب را ببندد، عامل دیگر نمی‌تواند به سایت شما دسترسی پیدا کند یا اقدامی انجام دهد.

از WebMCP و MCP استفاده کنید

هنگام انتخاب راهکار مناسب برای ویژگی‌ها یا عملکردهای خاص، زمینه و در دسترس بودن را در نظر بگیرید:

ام سی پی وب‌ام‌سی‌پی
هدف داده‌ها و اقدامات را در هر مکان و هر زمان در دسترس عوامل قرار می‌دهد. یک وب‌سایت زنده را برای تعامل فوری با نمایندگان هنگام بازدید کاربر از سایت آماده می‌کند.
چرخه حیات پایدار (سرور و دیمن) زودگذر (با تب)
اتصال جهانی (دسکتاپ، موبایل، فضای ابری، وب) مختص محیط (عامل‌های مرورگر)
تعامل رابط کاربری بدون سر و خارجی یکپارچه با مرورگر و آگاه از DOM
کشف جریان‌های ثبت‌نام مختص نماینده ابزارهایی که در طول بازدید کاربر در صفحه وب ثبت شده‌اند.
مورد استفاده اقدامات API پس‌زمینه را انجام می‌دهد. در یک رابط کاربری وب زنده، پیمایش و اجرا می‌کند.

مؤثرترین برنامه‌های عامل‌گرا از هر دو MCP و WebMCP استفاده می‌کنند تا از نقاط قوت هر دو فناوری بهره‌مند شوند.

  1. مدیریت منطق اصلی با MCP: سرور MCP شما به عنوان یک لایه سرویس بنیادی عمل می‌کند. این لایه، منطق اصلی کسب و کار، بازیابی داده‌ها و وظایف پس‌زمینه را مدیریت می‌کند. این امر تضمین می‌کند که سرویس شما مستقل از پلتفرم بوده و همیشه در دسترس عامل‌ها باشد.
  2. ساخت رابط کاربری زمینه‌ای با WebMCP: WebMCP مرحله نهایی است، اتصالی برای عامل‌ها به طور مستقیم به وب‌سایت شما. این ابزار برای تعاملات زمینه‌ای و درون مرورگر طراحی شده است و به یک عامل اجازه می‌دهد تا از طرف کاربر با سرعت و قابلیت اطمینان عمل کند، در حالی که کاربر وب‌سایت شما را باز کرده است.

MCP و WebMCP را به عنوان شریک در نظر بگیرید، نه رقیب. WebMCP روشی با دقت بالا برای یک عامل هوش مصنوعی مبتنی بر مرورگر فراهم می‌کند تا با دنیای خاصی که کاربر در تب خود می‌بیند، تعامل داشته باشد.

بعدش چی؟

آماده‌اید تا وب‌سایت خود را برای عامل آماده کنید؟ می‌توانید همین امروز با پیوستن به برنامه پیش‌نمایش اولیه، آزمایش WebMCP را آغاز کنید.

بازخورد شما در شکل‌دهی آینده این استاندارد بسیار مهم است.