ওয়েবএমসিপি

আলেকজান্দ্রা ক্লেপার
Alexandra Klepper

প্রকাশিত: ১৮ মে, ২০২৬

WebMCP হলো একটি প্রস্তাবিত ওয়েব স্ট্যান্ডার্ড যা এআই এজেন্টদের জন্য কাঠামোগত টুল তৈরি ও প্রকাশ করতে সাহায্য করে। WebMCP জাভাস্ক্রিপ্ট সরবরাহ করে এবং HTML ফর্ম এলিমেন্টগুলোকে টীকাযুক্ত করে, যাতে এজেন্টরা ব্যবহারকারীর অভিজ্ঞতাকে সমর্থন করার জন্য পেজের ফিচারগুলোর সাথে ঠিক কীভাবে ইন্টারঅ্যাক্ট করতে হবে তা জানতে পারে। এটি এজেন্ট অ্যাকচুয়েশনের পারফরম্যান্স এবং নির্ভরযোগ্যতা উল্লেখযোগ্যভাবে উন্নত করতে পারে।

এআই এজেন্ট একটি নতুন প্রযুক্তি। এটি মানুষকে অত্যন্ত জটিল ও প্রযুক্তিগত কাজ আরও ভালোভাবে সম্পন্ন করতে সাহায্য করতে পারে। WebMCP এজেন্টের মাধ্যমে কাজ সম্পন্ন করার ক্ষেত্রে উচ্চতর নির্ভুলতা প্রদান করে এবং এটিকে একটি প্রগতিশীল উন্নয়ন হিসেবে যুক্ত করা যেতে পারে।

WebMCP কেন?

WebMCP ইন্টারঅ্যাকশনের জন্য নিয়মাবলী প্রদানের মাধ্যমে ওয়েব অ্যাপ্লিকেশন এবং এজেন্টের মধ্যেকার ব্যবধান দূর করতে সাহায্য করে, যা কর্মদক্ষতা, নির্ভরযোগ্যতা এবং কাজ সম্পন্ন করার হার উন্নত করে। কোনো এজেন্টের বাটন বা ফিল্ডের মতো এলিমেন্টের উদ্দেশ্য বোঝার জন্য সেটিকে পর্যালোচনা করার পরিবর্তে, ওয়েবসাইটটিই এলিমেন্টটির উদ্দেশ্য ঘোষণা করে, ফলে এটি সঠিকভাবে ব্যবহৃত হয়।

এটি সক্রিয়করণের চেয়ে বেশি নির্ভরযোগ্য, কারণ সক্রিয়করণে একাধিক ধাপ থাকতে পারে এবং প্রতিটি ধাপ এজেন্টের ব্যাখ্যার জন্য উন্মুক্ত থাকে।

ওয়েবসাইটগুলো একটি টুল নির্ধারণের মাধ্যমে অনুসন্ধান বা কেনাকাটার মতো সুনির্দিষ্ট উদ্দেশ্য তুলে ধরতে পারে। এই টুলগুলো আপনার ওয়েবপেজে দৃশ্যমানভাবে কাজ করে, ফলে ব্যবহারকারীরা আস্থা লাভ করেন যে কাজগুলো প্রত্যাশা অনুযায়ী সম্পন্ন হচ্ছে। এটি আপনার ব্র্যান্ড এবং মানবকেন্দ্রিক ডিজাইনের সিদ্ধান্তগুলোকেও অক্ষুণ্ণ রাখে।

WebMCP সমর্থন করে:

  • ডিসকভারি : পেজগুলোর জন্য এজেন্টের সাথে টুল নিবন্ধন করার একটি প্রমিত উপায়, যেমন checkout বা filter_results
  • JSON স্কিমা : বিভ্রান্তি বা ভুল বোঝাবুঝি কমানোর জন্য ইনপুট এবং প্রত্যাশিত আউটপুটের সুস্পষ্ট সংজ্ঞা।
  • অবস্থা : বর্তমান পৃষ্ঠার প্রেক্ষাপট সম্পর্কে একটি সাধারণ বোঝাপড়া, যার ফলে এজেন্ট জানতে পারে যে রিয়েল টাইমে কাজ করার জন্য কোন রিসোর্সগুলো উপলব্ধ আছে।

আমাদের লক্ষ্য হলো এমন এপিআই (API) তৈরি করা যা এজেন্টিক (agentic) সক্ষমতা সম্পন্ন যেকোনো ব্রাউজার প্রয়োগ করতে এবং এর থেকে উপকৃত হতে পারে, যাতে আপনার ব্যবহারকারীরা আরও সহজে কাজগুলো সম্পন্ন করতে পারেন। আপনি গিটহাব (GitHub)- এ এই প্রক্রিয়াটি অনুসরণ করতে পারেন।

ব্যবহারের ক্ষেত্র

ওয়েবে WebMCP ব্যবহার করার অনেক উপায় আছে। উদাহরণস্বরূপ:

  • আপনার গ্রাহকদের সহায়তা পেতে সাহায্য করুন । আপনি যদি গ্রাহকদের কোনো সফটওয়্যার সরবরাহ করেন, তবে বিভিন্ন প্রশ্নের উত্তর দেওয়ার জন্য আপনার একটি জটিল সহায়তা প্রক্রিয়া থাকতে পারে। একজন এজেন্টকে আরও দ্রুত সঠিক ফর্মে যেতে এবং ব্যবহারকারীর দেওয়া তথ্য দিয়ে ফিল্ডগুলো পূরণ করতে সাহায্য করার জন্য আপনি WebMCP ব্যবহার করতে পারেন।
  • ভ্রমণ বুকিং উন্নত করুন । এজেন্টদেরকে কম ধাপে জটিল, একাধিক শহর ও একাধিক যাত্রীর ভ্রমণ বুক করতে সাহায্য করুন।

কিছু কাজ সংবেদনশীল হতে পারে, যেমন কেনাকাটা করা। এক্ষেত্রে আপনি একটি নিশ্চিতকরণ ডায়ালগের মাধ্যমে ব্যবহারকারীর অংশগ্রহণের অনুরোধ জানাতে একটি কমান্ড অন্তর্ভুক্ত করতে পারেন।

বাস্তবিক অর্থে, আপনার সরঞ্জামগুলো নিম্নলিখিত কাজগুলো সম্পন্ন করতে পারে:

  • কাঠামোগত ফর্ম পূরণ করুন : ব্যবহারকারীর সাথে কথোপকথন থেকে সংগৃহীত ডেটা এজেন্টদের ফর্মের ফিল্ডগুলোতে সঠিকভাবে মেলাতে সাহায্য করার জন্য একটি submit_application টুল তৈরি করুন। উদাহরণস্বরূপ, কোনো ফিল্ডে পুরো নাম লাগবে নাকি আলাদাভাবে শুধু প্রথম ও শেষ নাম লাগবে, তা আপনি আলাদা করতে পারবেন।
  • মানব-কেন্দ্রিক ইন্টারফেসে এজেন্টদের মিথস্ক্রিয়াকে সমর্থন করুন : কিছু ফিল্ড মানুষের ব্যবহারের জন্য ডিজাইন করা হলেও, এজেন্টরা তা বুঝতে নাও পারে। আপনি একটি date_pick টুল তৈরি করতে পারেন, যা রিজার্ভেশন বা ইভেন্ট বুকিংয়ের ক্ষেত্রে জটিল তারিখ ও সময় নির্বাচনের সুযোগ দেবে।
  • দ্রুততর অ্যাপ্লিকেশন ডিবাগিং : আপনি ডেভেলপার সেটিংস পৃষ্ঠায় একটি run_diagnostics টুল তৈরি করতে পারেন, যাতে একজন এজেন্ট এমন সব সমাধান চালু করতে পারে যা অন্যথায় নেস্টেড মেনুর আড়ালে লুকিয়ে থাকে।

আপনার ব্যবহারের ক্ষেত্রটি কি অনুপস্থিত? অথবা WebMCP-এর জন্য আপনার কি এমন কোনো ধারণা আছে যা আপনি জানাতে আগ্রহী? আর্লি প্রিভিউ প্রোগ্রামে যোগ দিন এবং আপনার মতামত জানান।

শুরু করুন

WebMCP স্থানীয় ডেভেলপমেন্টের জন্য একটি ক্রোম ফ্ল্যাগ হিসেবে উপলব্ধ। এটি ক্রোম ১৪৯-এ একটি অরিজিন ট্রায়াল হিসেবে পাওয়া যাবে।

স্থানীয়ভাবে WebMCP সক্রিয় করতে:

  1. ক্রোম খুলুন এবং chrome://flags/#enable-webmcp-testing এ যান।
  2. ফ্ল্যাগটি সক্ষম করুন
  3. পরিবর্তনগুলো প্রয়োগ করতে ক্রোম পুনরায় চালু করুন।

WebMCP API ব্যবহার করুন

আপনার ওয়েবসাইটের টুলগুলো সেট আপ করার জন্য আপনি দুটি এপিআই (API) ব্যবহার করতে পারেন:

  • ইম্পারেটিভ এপিআই : স্ট্যান্ডার্ড জাভাস্ক্রিপ্ট ব্যবহার করে বিভিন্ন ধরণের টুল সংজ্ঞায়িত করুন, যেমন ফর্ম ইনপুট, নেভিগেশন টুল, স্টেট ম্যানেজমেন্ট বা অন্যান্য ফাংশন।
  • ডিক্লারেটিভ এপিআই : একটি WebMCP টুল তৈরি করতে সাধারণ HTML ফর্মে অ্যানোটেশন যোগ করুন।

সীমাবদ্ধতা

যদিও WebMCP এজেন্ট এবং মানুষের জন্য জটিল কাজগুলোকে সহজ করার লক্ষ্য রাখে, এর কিছু সীমাবদ্ধতা রয়েছে:

  • ব্রাউজিং কনটেক্সট আবশ্যক : যেহেতু টুল কলগুলো জাভাস্ক্রিপ্টে পরিচালিত হয়, তাই একটি দৃশ্যমান ইন্টারফেস এবং ব্রাউজার কনটেক্সট প্রদানের জন্য একটি ব্রাউজার ট্যাব বা ওয়েবভিউ খোলা থাকা আবশ্যক। অন্য কথায়, হেডলেস অবস্থায় এজেন্ট বা সহায়ক টুলগুলোর টুল কল করার কোনো সমর্থন নেই।
  • জটিল ইন্টারফেসের জন্য অতিরিক্ত ওভারহেড : যদি আপনার সাইটটি অত্যন্ত জটিল হয়, তাহলে অ্যাপ্লিকেশন এবং ইন্টারফেসের অবস্থা পরিচালনা করার জন্য আপনাকে সম্ভবত সাইটটি রিফ্যাক্টর করতে হবে অথবা জাভাস্ক্রিপ্ট যোগ করতে হবে।
  • টুলের সন্ধানযোগ্যতা : কোনো সাইটে কল করার মতো টুল আছে কিনা তা জানতে ক্লায়েন্ট এবং ব্রাউজারকে অবশ্যই সরাসরি সেই সাইটটি ভিজিট করতে হবে।

ডেমো

ইম্পারেটিভ এবং ডিক্লারেটিভ উভয় ধরনের বাস্তবায়নের ডেমোর উদাহরণ পাওয়া যায়:

এছাড়াও আপনি গিটহাবে ডেমো সোর্স কোডটি পর্যালোচনা ও অন্বেষণ করতে পারেন।

ইন্সপেক্টর এক্সটেনশনের মাধ্যমে এজেন্ট চ্যাট অনুকরণ করুন

একটি এজেন্টের সাথে পরীক্ষা-নিরীক্ষা করতে এবং লাইভ ডেমো বা আপনার নিজের অ্যাপ্লিকেশনে WebMCP টুলগুলো কীভাবে কাজ করে তা দেখতে Model Context Tool Inspector Extension-টি ইনস্টল করুন । কোনো এজেন্ট WebMCP টুলগুলোর সাথে সঠিকভাবে ইন্টারঅ্যাক্ট করতে পারে কিনা তা দেখার জন্য আপনি স্বাভাবিক ভাষার প্রম্পট প্রবেশ করাতে পারেন।

এই এক্সটেনশনটির মাধ্যমে আপনি যা করতে পারবেন:

  • navigator.modelContext API পর্যবেক্ষণ করে দেখুন কোনো পৃষ্ঠায় কোন কোন টুল নিবন্ধিত আছে।
  • ম্যানুয়ালি টুলগুলো কল করুন এবং ফাংশনগুলো সম্পাদন করুন।
  • আপনার JSON স্কিমা সঠিকভাবে সংজ্ঞায়িত করা আছে কিনা এবং ব্রাউজারটি টুলটির প্রত্যাশা অনুযায়ী ডেটা পার্স করতে পারছে কিনা, তা যাচাই করুন।
  • আপনার টুল থেকে প্রাপ্ত কাঠামোগত আউটপুট বা ত্রুটির বার্তাগুলো পর্যালোচনা করে নিশ্চিত করুন যে সেগুলো স্পষ্টভাবে লেখা এবং সঠিকভাবে বিন্যস্ত করা হয়েছে, যাতে একজন এজেন্ট তা বুঝতে পারে।

এজেন্টটি যথাযথ WebMCP টুলগুলো সঠিকভাবে শনাক্ত ও চালু করতে পারে কিনা, তা দেখতে স্বাভাবিক ভাষায় তার সাথে কথা বলুন। আপনার প্রম্পটগুলো ডিফল্টরূপে gemini-3-flash-preview মডেলে পাঠানো হয়।

অংশগ্রহণ করুন এবং মতামত জানান

WebMCP নিয়ে সক্রিয় আলোচনা চলছে এবং ভবিষ্যতে এটিতে পরিবর্তন আসতে পারে। আপনি যদি এই API-গুলো ব্যবহার করে দেখেন এবং আপনার কোনো মতামত থাকে, তবে আমরা তা জানতে আগ্রহী।