पब्लिश किया गया: 18 मई, 2026
WebMCP वेब के लिए एक नया स्टैंडर्ड है. इसकी मदद से, एआई एजेंट के लिए स्ट्रक्चर्ड टूल बनाए और दिखाए जा सकते हैं. WebMCP, JavaScript उपलब्ध कराता है. साथ ही, एचटीएमएल फ़ॉर्म एलिमेंट को एनोटेट करता है, ताकि एजेंट को यह पता हो कि पेज की सुविधाओं के साथ कैसे इंटरैक्ट करना है. इससे उपयोगकर्ता को बेहतर अनुभव मिलता है. इससे, एजेंट के काम करने की परफ़ॉर्मेंस और भरोसेमंद तरीके से काम करने की क्षमता में काफ़ी सुधार हो सकता है.
एआई एजेंट, एक नई टेक्नोलॉजी है. ये लोगों को मुश्किल और तकनीकी टास्क बेहतर तरीके से पूरे करने में मदद कर सकते हैं. WebMCP की मदद से, एजेंट के टास्क ज़्यादा सटीक तरीके से पूरे किए जा सकते हैं. इसे प्रोग्रेसिव एनहांसमेंट के तौर पर जोड़ा जा सकता है.
WebMCP क्यों इस्तेमाल करें?
WebMCP, वेब ऐप्लिकेशन और एजेंट के बीच के अंतर को कम करने में मदद कर सकता है. साथ ही, इंटरैक्शन के लिए नियम उपलब्ध कराकर, काम करने की क्षमता, भरोसेमंद तरीके से काम करने की क्षमता, और टास्क पूरे करने की क्षमता को बेहतर बना सकता है. किसी बटन या फ़ील्ड जैसे एलिमेंट के मकसद को समझने के लिए, एजेंट को उसकी समीक्षा करने की ज़रूरत नहीं होती. इसके बजाय, वेबसाइट एलिमेंट का मकसद बताती है, ताकि उसका सही तरीके से इस्तेमाल किया जा सके
यह एक्चुएशन से ज़्यादा भरोसेमंद है. एक्चुएशन में कई चरण हो सकते हैं और हर चरण को एजेंट अपनी समझ के हिसाब से पूरा कर सकता है.
वेबसाइटें, tool को तय करके, खोज या खरीदारी जैसे मकसद के बारे में साफ़ तौर पर बता सकती हैं. टूल, आपके वेबपेज पर साफ़ तौर पर काम करते हैं. इससे उपयोगकर्ताओं को भरोसा होता है कि टास्क उनकी उम्मीद के मुताबिक पूरे होंगे. इससे, आपके ब्रैंड और लोगों की ज़रूरतों को ध्यान में रखकर डिज़ाइन किए गए विकल्पों को भी बरकरार रखा जा सकता है.
WebMCP इनके साथ काम करता है:
- डिस्कवरी: पेजों के लिए, एजेंट के साथ टूल रजिस्टर करने का एक स्टैंडर्ड तरीका. जैसे,
checkoutयाfilter_results. - JSON स्कीमा: इनपुट और अनुमानित आउटपुट की साफ़ तौर पर दी गई परिभाषाएं, ताकि गलत जानकारी या गलतफ़हमी की संभावना कम हो.
- स्टेट: मौजूदा पेज के कॉन्टेक्स्ट की साझा समझ, ताकि एजेंट को यह पता हो कि रीयल टाइम में किन संसाधनों का इस्तेमाल किया जा सकता है.
हमारा लक्ष्य ऐसे एपीआई बनाना है जिन्हें एजेंट की क्षमताओं वाला कोई भी ब्राउज़र लागू कर सके और उनसे फ़ायदा पा सके. इससे आपके उपयोगकर्ता, टास्क ज़्यादा आसानी से पूरे कर पाएंगे. आप इस प्रोसेस को GitHub पर फ़ॉलो कर सकते हैं.
इस्तेमाल के उदाहरण
वेब पर WebMCP का इस्तेमाल कई तरीकों से किया जा सकता है. उदाहरण के लिए:
- अपने ग्राहकों को सहायता उपलब्ध कराएं. अगर ग्राहकों को सॉफ़्टवेयर उपलब्ध कराया जाता है, तो कई अलग-अलग सवालों के जवाब देने के लिए, सहायता देने की प्रोसेस मुश्किल हो सकती है. WebMCP का इस्तेमाल करके, एजेंट को सही फ़ॉर्म पर तेज़ी से ले जाया जा सकता है. साथ ही, उपयोगकर्ता की दी गई जानकारी के साथ फ़ील्ड भरे जा सकते हैं.
- यात्रा की बुकिंग को बेहतर बनाएं. एजेंट को कम चरणों में, मुश्किल, एक से ज़्यादा शहरों की, और एक से ज़्यादा यात्रियों वाली यात्राएं बुक करने में मदद करें.
कुछ कार्रवाइयां संवेदनशील हो सकती हैं, जैसे कि खरीदारी करना. पुष्टि करने वाले डायलॉग के साथ उपयोगकर्ता के इंटरैक्शन का अनुरोध करने के लिए, एक कमांड शामिल की जा सकती है.
असल में, आपके टूल ये टास्क पूरे कर सकते हैं:
- स्ट्रक्चर्ड फ़ॉर्म भरना: एक
submit_applicationटूल बनाएं, ताकि एजेंट, उपयोगकर्ता के साथ बातचीत से इकट्ठा किए गए डेटा को फ़ॉर्म फ़ील्ड में सही तरीके से मैप कर सकें. उदाहरण के लिए, यह अंतर किया जा सकता है कि किसी फ़ील्ड में पूरा नाम ज़रूरी है या पहला और आखिरी नाम अलग-अलग. - लोगों की ज़रूरतों को ध्यान में रखकर डिज़ाइन किए गए इंटरफ़ेस में एजेंट के इंटरैक्शन को सपोर्ट करना: कुछ फ़ील्ड,
लोगों की ज़रूरतों को ध्यान में रखकर डिज़ाइन किए जाते हैं, लेकिन एजेंट उन्हें समझ नहीं पाते.
date_pickटूल बनाया जा सकता है. इससे रिज़र्वेशन या इवेंट बुकिंग में, तारीख और समय को मुश्किल तरीके से चुना जा सकता है. - ऐप्लिकेशन को डीबग करना: डेवलपर सेटिंग वाले पेज पर,
run_diagnosticsटूल बनाया जा सकता है. इससे एजेंट, उन समस्याओं को ठीक कर सकता है जो नेस्ट किए गए मेन्यू में छिपी होती हैं.
क्या आपका इस्तेमाल का उदाहरण मौजूद नहीं है? या क्या आपके पास WebMCP के लिए कोई ऐसा आइडिया है जिसे शेयर करने के लिए आप उत्साहित हैं? अर्ली प्रीव्यू प्रोग्राम में शामिल हों और अपने सुझाव या राय शेयर करें.
शुरू करें
WebMCP, स्थानीय डेवलपमेंट के लिए Chrome फ़्लैग के तौर पर उपलब्ध है. यह Chrome के वर्शन 149 में ऑरिजिन ट्रायल में उपलब्ध होगा.
WebMCP को स्थानीय तौर पर चालू करने के लिए:
- Chrome खोलें और
chrome://flags/#enable-webmcp-testingपर जाएं - फ़्लैग को चालू है पर सेट करें.
- बदलाव लागू करने के लिए, Chrome को फिर से लॉन्च करें.
WebMCP एपीआई का इस्तेमाल करना
अपनी वेबसाइट के टूल सेट अप करने के लिए, दो एपीआई का इस्तेमाल किया जा सकता है:
- इंपेरेटिव एपीआई: स्टैंडर्ड JavaScript की मदद से, अलग-अलग तरह के टूल तय करें. जैसे, फ़ॉर्म इनपुट, नेविगेशन टूल, स्टेट मैनेजमेंट या अन्य फ़ंक्शन.
- डिक्लेरेटिव एपीआई: WebMCP टूल बनाने के लिए, स्टैंडर्ड एचटीएमएल फ़ॉर्म में एनोटेशन जोड़ें.
सीमाएं
WebMCP का मकसद, एजेंट और लोगों के लिए मुश्किल टास्क को आसान बनाना है. हालांकि, इसकी कुछ सीमाएं हैं:
- ब्राउज़िंग कॉन्टेक्स्ट ज़रूरी है: टूल कॉल को JavaScript में हैंडल किया जाता है. इसलिए, दिखने वाला इंटरफ़ेस और ब्राउज़र कॉन्टेक्स्ट उपलब्ध कराने के लिए, ब्राउज़र टैब या वेबव्यू खोला जाना चाहिए. दूसरे शब्दों में कहें, तो एजेंट या ऐक्सेसिबिलिटी टूल के लिए, हेडलेस स्टेट में टूल कॉल करने की सुविधा उपलब्ध नहीं है.
- मुश्किल इंटरफ़ेस के लिए ज़्यादा ओवरहेड: अगर आपकी साइट बहुत मुश्किल है, तो आपको ऐप्लिकेशन और इंटरफ़ेस स्टेट को हैंडल करने के लिए, JavaScript को फिर से फ़ैक्टर करना या जोड़ना पड़ सकता है.
- टूल की खोज: क्लाइंट और ब्राउज़र को सीधे किसी साइट पर जाकर यह देखना होगा कि उसमें कॉल किए जा सकने वाले टूल हैं या नहीं.
अनुमतियों की नीति
दोनों एपीआई, tools अनुमतियों की नीति के तहत आते हैं.
यह नीति, डिफ़ॉल्ट रूप से self पर सेट होती है. इससे टॉप-लेवल और सेम-ऑरिजिन कॉन्टेक्स्ट में टूल रजिस्टर किए जा सकते हैं. साथ ही, क्रॉस-ऑरिजिन iframe के लिए, यह नीति बंद हो जाती है.
क्रॉस-ऑरिजिन iframe में WebMCP टूल की अनुमति देने के लिए, iframe में allow="tools"
एट्रिब्यूट जोड़ें.
डेमो
इंपेरेटिव और डिक्लेरेटिव, दोनों तरह के लागू करने के उदाहरण उपलब्ध हैं:
- WebMCP zaMaker WebMCP इंपेरेटिव एपीआई का इस्तेमाल करता है.
- ट्रैवल डेमो (React) WebMCP इंपेरेटिव एपीआई का इस्तेमाल करता है.
- Le Petit Bistro डेमो WebMCP डिक्लेरेटिव एपीआई का इस्तेमाल करता है.
GitHub पर, डेमो के सोर्स कोड की समीक्षा की जा सकती है और उसे एक्सप्लोर किया जा सकता है. GitHub.
इंस्पेक्टर एक्सटेंशन की मदद से, एजेंट के साथ चैट की नकल करना
एजेंट के साथ एक्सपेरिमेंट करने के लिए, मॉडल कॉन्टेक्स्ट टूल इंस्पेक्टर एक्सटेंशन इंस्टॉल करें. साथ ही, देखें कि लाइव डेमो या आपके अपने ऐप्लिकेशन में WebMCP टूल कैसे काम करते हैं. यह पता लगाने के लिए, नैचुरल लैंग्वेज प्रॉम्प्ट का इस्तेमाल करें कि एजेंट, WebMCP टूल के साथ उम्मीद के मुताबिक इंटरैक्ट करता है या नहीं.
एक्सटेंशन की मदद से, ये काम किए जा सकते हैं:
navigator.modelContextएपीआई की निगरानी करके, यह देखा जा सकता है कि किसी पेज पर कौनसा टूल रजिस्टर किया गया है.- मैन्युअल तरीके से टूल कॉल किए जा सकते हैं और फ़ंक्शन लागू किए जा सकते हैं.
- यह पुष्टि की जा सकती है कि JSON स्कीमा सही तरीके से तय किया गया है और ब्राउज़र, टूल की उम्मीद के मुताबिक डेटा पार्स कर सकता है.
- यह देखने के लिए कि आपके टूल से मिले स्ट्रक्चर्ड आउटपुट या गड़बड़ी के मैसेज साफ़ तौर पर लिखे गए हैं और सही तरीके से फ़ॉर्मैट किए गए हैं या नहीं, उन्हें देखा जा सकता है. इससे एजेंट को उन्हें समझने में मदद मिलती है.
नैचुरल लैंग्वेज का इस्तेमाल करके, एजेंट से बात करें. इससे यह देखा जा सकता है कि वह सही WebMCP टूल की पहचान कर सकता है और उन्हें लागू कर सकता है या नहीं. आपके प्रॉम्प्ट, डिफ़ॉल्ट रूप से gemini-3-flash-preview मॉडल को भेजे जाते हैं.
सुझाव या राय देना और बातचीत में शामिल होना
WebMCP पर फ़िलहाल चर्चा चल रही है. आने वाले समय में, इसमें बदलाव हो सकता है. अगर आपने इन एपीआई को आज़माया है और आपके पास कोई सुझाव या राय है, तो हमें बताएं.
- WebMCP के बारे में जानकारी देने वाला लेख पढ़ें, सवाल पूछें, और चर्चा में शामिल हों.
- WebMCP इस्तेमाल करने के सबसे सही तरीके पढ़ें.
- Chrome Status पर, Chrome के लिए लागू करने की प्रोसेस की समीक्षा करें.
- नए एपीआई को सबसे पहले देखने और हमारी मेलिंग सूची का ऐक्सेस पाने के लिए, अर्ली प्रीव्यू प्रोग्राम में शामिल हों
- अगर आपके पास Chrome के लागू करने की प्रोसेस के बारे में कोई सुझाव या राय है, तो Chromium में गड़बड़ी की शिकायत करें.