প্রকাশিত: ২২ জুন, ২০২৬
P2ER , একটি ডিজিটাল সলিউশন এজেন্সি, এজেন্টদের জন্য ক্রোম ডেভটুলস ব্যবহার করে এটা নিশ্চিত করে যে শুধুমাত্র যাচাইকৃত ও কার্যকর সফটওয়্যারই চূড়ান্ত পর্যালোচনার জন্য মানুষের কাছে পাঠানো হয়। তাদের কর্মপ্রবাহকে একটি এজেন্টিক অবকাঠামোতে রূপান্তরিত করার মাধ্যমে, তারা এআই এজেন্টদেরকে অভিজ্ঞতালব্ধ ইউআই যাচাইকরণ সম্পাদনে সক্ষম করেছে, যার ফলে ডেপ্লয়মেন্টের হার সপ্তাহে একবার থেকে বেড়ে দিনে একাধিকবার হয়েছে।
চ্যালেঞ্জ: বিদ্যমান অ্যাপ্লিকেশনগুলিতে গুণমানের পরিধি বৃদ্ধি করা।
P2ER গাড়ি নির্মাতা, ঘড়ির ব্র্যান্ড এবং হসপিটালিটি কোম্পানি সহ বিশ্বব্যাপী ব্র্যান্ডগুলির জন্য উচ্চমানের ডিজিটাল অভিজ্ঞতা প্রদান করে। অনেক কোম্পানির মতোই, তাদের প্রধান চ্যালেঞ্জ ছিল জটিল ও বিদ্যমান অ্যাপ্লিকেশনগুলির মধ্যে কাজ করা। এজেন্টিক কোডিং গ্রহণকারী দলটি তিনটি প্রধান বাধার সম্মুখীন হয়েছিল:
- দুর্বল UI টেস্টিং। P2ER-এর কিছু প্রজেক্টে হোটেলের ওঠানামা করা দাম বা মৌসুমী অফারের মতো ডাইনামিক ডেটার ক্ষেত্রে স্ট্যান্ডার্ড টেস্ট স্যুটগুলো হিমশিম খেত। মক ডেটা প্রায়শই ইন্টিগ্রেশনের এমন সব ত্রুটি লুকিয়ে রাখত, যা একজন মানুষ পরীক্ষক সঙ্গে সঙ্গেই খুঁজে পেতেন।
- এজেন্টের নির্ভরযোগ্যতা নিয়ে সমস্যা। সুস্পষ্ট নির্দেশনা ছাড়া, এআই এজেন্টরা কখনও কখনও কাজটি যাচাই না করেই সম্পন্ন হয়েছে বলে দাবি করত।
- প্রসঙ্গের অভাব। ব্যাপক কাজ এবং মডেল টাইমআউটের কারণে এজেন্টরা সেশনের লক্ষ্য থেকে বিচ্যুত হয়ে পড়ত। এর ফলে ডেভেলপারদের পক্ষে কোনো এজেন্টের শুরু করা কাজের সূত্র ধরে এগিয়ে যাওয়া এবং তা চালিয়ে যাওয়া কঠিন হয়ে পড়ত।
সমাধান: কারুশিল্পের জন্য অবকাঠামো নির্মাণ করা
P2ER এমন একটি পরিকাঠামো তৈরি করেছে যা AI-কে একটি "সহযোগী" হিসেবে বিবেচনা করে, যা উন্নয়নের পুনরাবৃত্তিমূলক দিকগুলোও সামলাতে পারে। এই পদ্ধতিটি দলটিকে আর্কিটেকচার এবং সৃজনশীল সমস্যা সমাধানের উপর মনোযোগ দিয়ে তাদের কারুকার্যকে উন্নত করতে সাহায্য করে।
এজেন্টদের এমসিপি সার্ভারের জন্য ডেভটুলস ব্যবহার করে অভিজ্ঞতামূলক যাচাইকরণ প্রয়োগ করুন।
নির্ভরযোগ্যতা নিশ্চিত করার জন্য, P2ER একটি বাধ্যতামূলক প্রায়োগিক যাচাইকরণ নিয়ম প্রতিষ্ঠা করেছে। প্রকল্পের AGENTS.md ফাইলে বিধিবদ্ধ এই প্রকৌশলগত নির্দেশনায় বলা হয়েছে:
All claims regarding service availability and component rendering
MUST be empirically verified (log output, dev compiler, browser/devtools inspection)
before asserting to the user.
এজেন্টের কথায় বিশ্বাস করার পরিবর্তে, টিমটি এজেন্টদের জন্য ক্রোম ডেভটুলস ব্যবহার করে, যাতে তারা অ্যাপ্লিকেশনটি দৃশ্যত ও ইন্টারেক্টিভভাবে নেভিগেট করার জন্য একটি নিরাপদ পরিবেশ পায়।
এই "টেস্টিং এজেন্টগুলি" বেশ কিছু গুরুত্বপূর্ণ কাজ সম্পাদন করে যা সাধারণ স্ট্যাটিক টেস্টে বাদ পড়ে যায়:
- ডাইনামিক ডেটা টেস্টিং: এমনকি একটি স্টেজিং এনভায়রনমেন্টেও, এজেন্টরা বাস্তব, পরিবর্তনশীল ডেটার (যেমন বিভিন্ন ঋতুতে হোটেলের দামের পরিবর্তন) বিপরীতে পরীক্ষা করে, যাতে তারা অ্যাপ্লিকেশনটি ঠিক একজন ব্যবহারকারীর মতোই অনুভব করতে পারে। এজেন্টদের ইন্টারঅ্যাকশন টুল যেমন
new_page,navigate_page,fill,click, এবংhoverজন্য DevTools এই সুবিধাটি প্রদান করে, যা তাদেরgithub-issue-testস্কিলে উল্লেখ করা হয়েছে। এটি এজেন্টকে ডাইনামিকভাবে অথেন্টিকেট করতে এবং একজন ব্যবহারকারীর বাস্তবসম্মত ক্লিক পাথ অনুকরণ করতে সাহায্য করে। - ভিজ্যুয়াল অডিট: এজেন্টরা ফিগমা লেআউট এবং প্রকৃত বাস্তবায়নের মধ্যেকার দৃশ্যগত অমিল শনাক্ত করে। এজেন্টদের জন্য ডেভটুলস-এর
take_screenshotটুলটি ব্যবহার করে, তাদেরfigma-validateস্কিলটি লাইভ স্টোরিবুক রেন্ডারের উচ্চ-রেজোলিউশনের স্ক্রিনশট ক্যাপচার করে, যাতে ফিগমা এক্সপোর্টের সাথে পাশাপাশি তুলনা করা যায়। - ব্যবহারযোগ্যতা যাচাই: এজেন্টরা এমন সব অনুপস্থিত অনুবাদ বা ব্যবহারযোগ্যতার ত্রুটি শনাক্ত করে যা স্বয়ংক্রিয় স্ক্রিপ্টগুলো প্রায়শই এড়িয়ে যায়। অ্যাক্সেসিবিলিটি ট্রি-এর সাথে সরাসরি ইন্টারঅ্যাক্ট করে এবং
take_snapshotওtake_screenshotমাধ্যমে সংগৃহীত ভিজ্যুয়াল স্ন্যাপশটগুলো পর্যালোচনা করে, এজেন্টরা তাদের স্বয়ংক্রিয় যাচাইকরণ ওয়ার্কফ্লোতে সুস্পষ্টভাবে নির্দেশিত অনুযায়ী `MISSING_MESSAGE` স্ট্রিং-এর মতো UI অসঙ্গতিগুলোর জন্য সক্রিয়ভাবে স্ক্যান করে।
উপ-কাজগুলিকে বিভক্ত করুন এবং স্থায়ী করুন
সেশন টাইমআউট এবং কনটেক্সট লস মোকাবেলা করার জন্য, P2ER সাব-এজেন্টদের মাধ্যমে কাজকে কঠোরভাবে ভাগ করে নেয়। তারপর তারা তাদের এজেন্টদেরকে অর্কেস্ট্রেটর হিসেবে কাজ করার জন্য এইভাবে নির্দেশ দেয়:
Rather than executing everything in the main thread, you must decompose large
or complex objectives into modular subtasks that can be delegated
to specialized subagents.
এই প্রক্রিয়ায় প্রোডাক্ট ওনারদের অবহিত রাখতে, টিমটি এজেন্টদের জন্য একটি কাস্টম স্কিল যুক্ত করেছে, যার মাধ্যমে তারা গিটহাব ইস্যুগুলোতে নিজেদের কাজ ট্র্যাক করতে পারে। এটি নিশ্চিত করে যে প্রতিটি সাব-এজেন্টের টাস্ক এবং তার ফলাফল গিটহাব এপিআই ব্যবহার করে একটি সাব-ইস্যু হিসেবে সংরক্ষিত ও নথিভুক্ত হয়, যা একটি স্পষ্ট অডিট ট্রেইল এবং স্থায়ী প্রেক্ষাপট তৈরি করে, যা অন্য ডেভেলপাররা অনুসরণ করতে পারে।
সমান্তরাল নির্বাহের জন্য পরিবেশগুলিকে পৃথক করুন
তাদের ডেভেলপমেন্ট প্রক্রিয়াকে এমনভাবে স্কেল করতে যাতে একাধিক এজেন্ট সমান্তরালভাবে কোড চালাতে পারে, P2ER তাদের এজেন্টদের জন্য প্রতিটি কাজের জন্য পৃথক পরিবেশ বাধ্যতামূলক করেছে। এটি UI যাচাইকরণের সময় স্টেট কনফ্লিক্ট এবং নেটওয়ার্ক সমস্যা প্রতিরোধ করে।
এই বিচ্ছিন্নকরণের প্রযুক্তিগত ব্যবস্থার মধ্যে অন্তর্ভুক্ত রয়েছে:
- বিচ্ছিন্ন গিট ওয়ার্কট্রি: একাধিক এজেন্ট সমান্তরালভাবে কাজ করার সময় ফাইল সংঘর্ষ এবং ওয়ার্কস্পেস দূষণ রোধ করতে, টাস্কগুলো বিচ্ছিন্ন গিট ওয়ার্কট্রির মধ্যে সম্পাদিত হয়। প্রতিটি এজেন্ট একটি নির্দিষ্ট ফাইল সিস্টেম স্পেস পায় যেখানে এনভায়রনমেন্ট ভেরিয়েবল কপি করা হয় এবং ডিপেন্ডেন্সিগুলো সিমলিঙ্ক করা হয়, যা নিশ্চিত করে যে ফাইলের পরিবর্তনগুলো কখনোই একে অপরকে ওভাররাইট করবে না।
- স্বতন্ত্র পরিবেশ: প্রতিটি এজেন্ট এবং টাস্ক একটি স্বতন্ত্র বিচ্ছিন্ন পোর্টে তাদের Next.js ডেভেলপমেন্ট সার্ভার চালায়। তাদের প্রোজেক্টের নিয়ম অনুযায়ী, নেটওয়ার্ক সংঘাত ছাড়াই সমান্তরাল কার্যসম্পাদন নিশ্চিত করতে
npx next dev -p <custom_port> --turbopackমাধ্যমে সার্ভারগুলো ডাইনামিকভাবে চালু করা হয়। - ডাটাবেস ক্লোন: প্যারালাল টেস্টিং চলাকালীন ডেটা সংঘর্ষ এড়াতে, P2ER এজেন্ট চালু হওয়ার সময় প্রোগ্রাম্যাটিকভাবে মূল ডাটাবেসটিকে একটি টাস্ক-নির্দিষ্ট স্কিমাতে ডুপ্লিকেট করে। এজেন্ট তার যাচাইকরণ সম্পন্ন করার পর এবং টাস্কটি অনুমোদিত হলে, একটি স্বয়ংক্রিয় ক্লিনআপ প্রক্রিয়া বিচ্ছিন্ন ডাটাবেসটিকে মুছে ফেলে। এই লাইফসাইকেলটি নিশ্চিত করে যে প্রতিটি এজেন্ট একটি ত্রুটিহীন ওয়ার্কস্পেসে কাজ করে এবং কোনো ড্যাংলিং ডেটা রেখে যায় না।
- নির্দিষ্ট লক্ষ্যভিত্তিক পরীক্ষা: এজেন্টদের জন্য Chrome DevTools-এর মাধ্যমে করা সমস্ত ব্রাউজার টেস্টিং অবশ্যই সেই নির্দিষ্ট এজেন্ট ইনস্ট্যান্সের জন্য বরাদ্দ করা সঠিক কাস্টম পোর্টকে লক্ষ্য করে করতে হবে। তাদের টেস্টিং নির্দেশনায় ডিফল্ট পোর্ট হার্ডকোড করা নিষিদ্ধ, এবং এর জন্য
http://localhost:<custom_port>-এর মতো টেস্ট টার্গেট URL প্রয়োজন হয়।
ফলাফল: গুণমান বজায় রেখে উন্নয়নের গতি ১০ গুণ বৃদ্ধি
উচ্চ-আস্থার রক্ষাকবচসহ এজেন্টিক কোডিং-এ স্থানান্তর P2ER-এর আউটপুটকে রূপান্তরিত করেছে। এই পরিবর্তনগুলি মূলত এজেন্টের নির্ভরযোগ্য কার্যকারিতা নিশ্চিত করার জন্য প্রয়োজনীয় ছিল, কিন্তু এগুলি সমগ্র উন্নয়ন জীবনচক্রের জন্যও উপকারী হয়েছে:
- ১০ গুণ দ্রুততর কাজের চক্র: আগের ১-৩ দিনের গড়ের তুলনায় এখন বেশিরভাগ সমস্যা একদিনের মধ্যেই সমাধান করা হয়। ডেপ্লয়মেন্টের হার সপ্তাহে একবার থেকে বেড়ে দিনে একাধিকবার হয়েছে।
- QA টিমের জন্য কৌশলগত মনোযোগ : যেহেতু এজেন্টরা এখন সাধারণ রিগ্রেশন এবং সহজ সমাধানগুলো ধরতে পারে, তাই মানব টেস্টিং টিম আরও গভীর ও জটিল টেস্ট সিনারিওগুলোর উপর মনোযোগ দিতে পারে।
- স্টেকহোল্ডারদের জন্য সুদৃঢ় বাস্তবায়ন: বাস্তবায়নগুলো এখন আরও স্থিতিস্থাপক, কারণ টেস্টিং এখন প্রোগ্রামারের গতানুগতিক "হ্যাপি পাথ"-এর বাইরে চলে গেছে।
- সুস্পষ্ট যোগাযোগ এবং শনাক্তকরণযোগ্যতা: 'মানবিক সমস্যা থেকে বাস্তবায়ন-সংক্রান্ত উপ-সমস্যা' এই নিয়মটি প্রয়োগ করার মাধ্যমে, অংশীজনরা প্রযুক্তিগত বাস্তবায়নের বিবরণ এবং সেগুলি কীভাবে পরীক্ষা করতে হবে সেই সংক্রান্ত তথ্যে ভারাক্রান্ত টিকিট পড়ার পরিবর্তে, কী কী যৌক্তিক উন্নতি করা হয়েছে সে সম্পর্কে স্পষ্ট নির্দেশনা পান।
এটি কীভাবে উন্নয়নের গতিকে প্রভাবিত করে তার একটি উদাহরণ হিসেবে বলা যায়, P2ER ছয় মাসে একটি নতুন প্ল্যাটফর্ম তৈরি করেছে, যা তাদের প্রতিষ্ঠিত পদ্ধতি ব্যবহার করলে বহু বছর সময় লাগত। মানুষই চূড়ান্ত মান যাচাইয়ের ধাপ হিসেবে কাজ করে, যারা এজেন্টদের দ্বারা ইতিমধ্যে যাচাইকৃত পুল রিকোয়েস্টগুলো পর্যালোচনা করে।
দলগুলোর জন্য প্রযুক্তিগত অন্তর্দৃষ্টি
এই কর্মপ্রবাহটি তৈরি করার সময়, P2ER এমন বেশ কিছু কৌশল চিহ্নিত করেছিল যা তাদেরকে পরীক্ষা-নিরীক্ষা পর্যায় থেকে একটি পরিণত, এজেন্ট-সহায়তাযুক্ত উন্নয়ন মডেলে রূপান্তরিত হতে সাহায্য করেছিল।
এই কৌশলগুলো অন্যান্য দলগুলোকে তাদের নিজস্ব সক্রিয় বাস্তবায়নকে আরও উন্নত করতে সাহায্য করতে পারে:
স্ক্রিপ্ট ইনজেকশন এবং CLI ব্যাচিংয়ের মাধ্যমে টোকেন ব্যবহার অপ্টিমাইজ করুন
দীর্ঘ ডেভেলপমেন্ট সেশনের সময় MCP সার্ভারগুলো টোকেন-নির্ভর হয়ে উঠতে পারে, যদি এজেন্টরা শুধুমাত্র ধাপে ধাপে নেভিগেশনের উপর নির্ভর করে (উদাহরণস্বরূপ, একটি স্ন্যাপশট নেওয়া, একটি আইডি খুঁজে বের করা, একটি ইনপুট পূরণ করা এবং অপেক্ষা করা)। এই অতিরিক্ত চাপ কমাতে, P2ER একটি দ্বিবিধ পদ্ধতি ব্যবহার করে:
- ইনলাইন স্ক্রিপ্ট ইনজেকশন: নির্দিষ্ট ইন্টারঅ্যাকশনের জন্য, যেমন জটিল React ফর্মের মাধ্যমে প্রমাণীকরণের ক্ষেত্রে, এজেন্টরা সরাসরি ব্রাউজারে ভ্যানিলা জাভাস্ক্রিপ্ট ইনজেক্ট করতে
evaluate_scriptটুলটি ব্যবহার করে। এটি বিল্ট-ইন সেটার ওভাররাইডগুলিকে বাইপাস করে এবং একবারে একাধিক অ্যাকশন সম্পাদন করে, যার ফলে কথোপকথনের অনেক ধাপ বেঁচে যায়। - CLI স্ক্রিপ্ট ব্যাচিং: যখন এজেন্টরা কোনো বাধার সম্মুখীন হয় বা অত্যন্ত দীর্ঘ ও পুনরাবৃত্তিমূলক ব্রাউজার ফ্লো-এর মুখোমুখি হয়, তখন তারা একটি CLI ব্যাচিং ফলব্যাকে চলে যায়। বারবার ব্যবহৃত স্বতন্ত্র MCP টুলগুলোর জন্য টোকেন খরচ করা বা একেবারে নতুন করে কাস্টম অটোমেশন স্ক্রিপ্ট লেখার পরিবর্তে, P2ER ব্রাউজার অ্যাকশনগুলোকে সংরক্ষণ ও ব্যাচ করার জন্য Chrome DevTools CLI-কে নির্দেশ দেয়। এটি এজেন্টদেরকে প্রোগ্রাম্যাটিকভাবে একবারে সম্পূর্ণ বহু-ধাপের ফ্লো সম্পাদন করার সুযোগ দেয়, যা মডেল এবং টুলের মধ্যে ক্রমাগত যোগাযোগের অতিরিক্ত চাপকে ব্যাপকভাবে হ্রাস করে।
ট্রেস অ্যানালাইসিসের মাধ্যমে পারফরম্যান্স ট্র্যাকিং স্বয়ংক্রিয় করুন
শুধুমাত্র মানুষের উপলব্ধির উপর নির্ভর করার পরিবর্তে, P2ER একটি review-performance স্কিল তৈরি করেছে যা এজেন্টদের জন্য ডেভটুলস ব্যবহার করে স্বয়ংক্রিয় লাইটহাউস অডিট এবং পারফরম্যান্স ট্রেস চালায়।
এজেন্টরা কোর ওয়েব ভাইটালস (LCP, INP, CLS) ক্যাপচার ও তদন্ত করতে এবং মেইন থ্রেডের বাধা বা লেআউটের পরিবর্তন শনাক্ত করতে performance_start_trace এবং performance_analyze_insight টুল ব্যবহার করে। কোয়ালিটি গেটকে সম্পূর্ণ করতে, এজেন্টরা অ্যাক্সেসিবিলিটি (a11y), এসইও এবং সাধারণ ওয়েব সেরা অনুশীলনের রিগ্রেশনের বিরুদ্ধে বিশেষভাবে সতর্ক থাকার জন্য একটি সম্পূর্ণ lighthouse_audit চালাতে পারে, যা নিশ্চিত করে যে শুধুমাত্র উচ্চ-মানের কোডই পুল রিকোয়েস্টের জন্য জমা দেওয়া হয়।
এজেন্টদের জন্য Chrome DevTools ব্যবহার করে যাচাইকরণ উন্নত করুন
তাদের নিজস্ব দক্ষতার পাশাপাশি, P2ER কার্যকরী যাচাইকরণ সম্পাদনের জন্য Chrome DevTools for agents MCP সার্ভারের মূল সক্ষমতাগুলো ব্যবহার করে। এর মধ্যে রয়েছে সার্ভার ব্যবহার করে বিভিন্ন ডিভাইস অনুকরণ করা এবং রেসপন্সিভনেস পরীক্ষা করা, যা নিশ্চিত করে যে ইউজার ইন্টারফেসটি বিভিন্ন স্ক্রিনের আকার এবং ডিভাইসে কাজ করে।
এমসিপি সার্ভার ব্যবহার করে অ্যাপ্লিকেশনটি নেভিগেট করার মাধ্যমে, এজেন্টরা লেআউট এবং প্রকৃত বাস্তবায়নের মধ্যেকার দৃশ্যগত অমিলগুলো শনাক্ত করতে পারে, যার ফলে এমন সব ত্রুটি চিহ্নিত হয় যা স্ট্যাটিক টেস্ট প্রায়শই এড়িয়ে যায়।
সম্পদ
P2ER-এর ব্যবহার আরও ভালোভাবে জানতে, উল্লেখিত সমস্ত স্কিল তাদের সংশ্লিষ্ট গিটহাব রিপোজিটরিতে দেখুন।
নিজে শুরু করতে এবং এজেন্টদের জন্য ডেভটুলস ব্যবহার করে অনুরূপ ওয়ার্কফ্লো বাস্তবায়ন সম্পর্কে আরও জানতে, এই রিসোর্সগুলো দেখুন: