I/O 2025 এ আমাদের AI আলোচনা দেখুন

আলেকজান্দ্রা ক্লেপার
Alexandra Klepper

প্রকাশিত: ২২ মে, ২০২৫

এআই ওয়েব ডেভেলপারদের ওয়েবসাইট এবং ওয়েব অ্যাপ্লিকেশন তৈরির পদ্ধতিকে বদলে দিচ্ছে। গুগল আই/ও ২০২৫-এ, আমরা গত এক বছর ধরে কী নিয়ে কাজ করছি তা তুলে ধরেছি, আমাদের অংশীদাররা কীভাবে ওয়েবে এআই ব্যবহার করছেন তা প্রদর্শন করেছি এবং নতুন বিল্ট-ইন এআই এপিআই ঘোষণা করেছি

আপনি কি অনুষ্ঠানটি মিস করেছেন? সুখবর, এখন আপনি আলোচনাগুলো অন-ডিমান্ড দেখতে পারবেন!

ক্রোমে জেমিনি ন্যানো সহ কার্যকরী বিল্ট-ইন এআই

আমাদের মূল লক্ষ্য হলো সকল ডেভেলপার ও ব্যবহারকারীর জন্য ক্রোম এবং ওয়েবকে আরও স্মার্ট করে তোলা। এই আলোচনায়, টমাস স্টেইনার অন্তর্নির্মিত এআই- এর আপডেট, এর বাস্তব ব্যবহার এবং আমাদের ভবিষ্যৎ পরিকল্পনা তুলে ধরেছেন।

অন্তর্নির্মিত এআই ব্রাউজারে ক্লায়েন্ট-সাইড মডেলগুলো চালায়, যার বেশ কিছু সুবিধা রয়েছে:

  • ব্যক্তিগত : সংবেদনশীল ব্যবহারকারীর তথ্য ডিভাইসেই থাকে, এর জন্য ব্রাউজার থেকে বের হওয়ার কোনো প্রয়োজন হয় না।
  • অফলাইন : অ্যাপ্লিকেশনগুলো ইন্টারনেট সংযোগ ছাড়াও এআই-এর সক্ষমতা ব্যবহার করতে পারে।
  • কর্মক্ষম : হার্ডওয়্যার অ্যাক্সিলারেশনের কল্যাণে, এই এপিআইগুলো চমৎকার পারফরম্যান্স প্রদান করে।

প্রতিটি বিল্ট-ইন এআই এপিআই- এর কোড স্যাম্পলগুলো দেখে নিন, সেগুলোর বর্তমান অবস্থা সম্পর্কে জানুন এবং দেখুন কোন কোন কোম্পানি এই প্রযুক্তি বাস্তবায়ন করছে।

মাল্টিমোডাল এপিআই

আমরা একেবারে নতুন মাল্টিমোডাল এপিআই নিয়ে কাজ করছি। এর মানে হলো, আপনি মডেলকে জিজ্ঞাসা করতে পারবেন যে এটি ভিজ্যুয়াল কন্টেন্টে কী 'দেখছে' বা অডিও কন্টেন্টে কী 'শুনছে'। উদাহরণস্বরূপ, একটি ব্লগ প্ল্যাটফর্মে আপলোড করা ছবির জন্য বিকল্প টেক্সটের পরামর্শ নিন, যা ব্যবহারকারীরা নিজেদের মতো করে পরিমার্জন ও পরিবর্তন করতে পারবেন। অথবা, আপনি জেমিনি ন্যানোকে পডকাস্টের জন্য বিবরণ বা ট্রান্সক্রিপশন লিখতে বলতে পারেন।

হাইব্রিড এআই

ক্লায়েন্ট-সাইড এআই নিয়ে ডেভেলপারদের একটি চ্যালেঞ্জ হলো, সব প্ল্যাটফর্ম এবং ব্রাউজার ডিভাইসে একটি মডেল চালানোর জন্য প্রয়োজনীয় হার্ডওয়্যারের চাহিদা পূরণ করে না। জেমিনি এবং ফায়ারবেস অংশীদারিত্বের মাধ্যমে ফায়ারবেস ওয়েব এসডিকে তৈরি করেছে, যাতে ক্লায়েন্ট-সাইড বাস্তবায়ন অনুপলব্ধ হলে, সার্ভারে থাকা জেমিনি ন্যানো ব্যবহার করা যায়।

আপনার সাথে কাজ করা

বিল্ট-ইন এআই এপিআই তৈরিতে এতজন ডেভেলপারের সাথে কাজ করতে পেরে আমরা অত্যন্ত আনন্দিত। আপনাদের ছাড়া আমাদের এই প্রচেষ্টা সম্ভব হতো না।

  • আর্লি প্রিভিউ প্রোগ্রাম : ১৬,০০০-এরও বেশি ডেভেলপার EPP- তে যোগদান করেছেন, যারা নতুন API পরীক্ষা করছেন, নতুন ব্যবহারের ক্ষেত্র আবিষ্কার করছেন এবং ওয়েবের জন্য আরও উন্নত AI তৈরির লক্ষ্যে মতামত প্রদান করছেন।
  • হ্যাকাথন : আমরা দুটি হ্যাকাথনের আয়োজন করেছি এবং আপনারা কিছু অসাধারণ ওয়েবসাইট ও এক্সটেনশন তৈরি করেছেন

আপনার কাজ এখনও শেষ হয়নি। আপনার মতামত জানাতে থাকুন, নতুন বিল্ট-ইন এপিআইগুলো পরীক্ষা করতে থাকুন, এবং আমরাও এর উন্নতি সাধন করতে থাকব। এমনকি আপনি W3C-এর ওয়েব মেশিন লার্নিং কমিউনিটি গ্রুপে যোগ দিয়ে এই এপিআইগুলোকে মানসম্মত করতেও সাহায্য করতে পারেন।

আপনার ব্রাউজারে জেমিনির সাথে ক্রোম এক্সটেনশনের ভবিষ্যৎ

গত দুই বছরে এআই-চালিত এক্সটেনশনের সংখ্যা দ্বিগুণ হয়েছে। প্রকৃতপক্ষে, ক্রোম ওয়েব স্টোর থেকে ইনস্টল করা সমস্ত এক্সটেনশনের ১০% এআই ব্যবহার করে। এই আলোচনায়, সেবাস্টিয়ান বেঞ্জ বাস্তব উদাহরণের মাধ্যমে ব্যাখ্যা করেছেন কেন ক্রোম এক্সটেনশন এবং জেমিনি এত শক্তিশালী একটি সমন্বয়।

উদাহরণস্বরূপ, ক্রোমের সদ্য চালু হওয়া প্রম্পট এপিআই ব্যবহার করে ক্লায়েন্ট পর্যায়ে ওয়েবসাইট থেকে ডেটা সংগ্রহ ও প্রক্রিয়াকরণের মাধ্যমে কীভাবে ব্রাউজারকে আরও সহায়ক করে তোলা যায়, তা দেখানো হয়েছে।

ব্যবহারকারীদের জন্য অডিও এবং ছবিকে আরও সহজলভ্য করতে ক্রোম এক্সটেনশনগুলিতে ক্রোমের প্রম্পটিং এপিআই-এর নতুন মাল্টিমোডাল সক্ষমতার সম্ভাবনা প্রদর্শন করা।

গুগল ডিপমাইন্ডের প্রজেক্ট মেরিনার কীভাবে ক্রোম এক্সটেনশন এবং সর্বশেষ জেমিনি ক্লাউড এপিআই ব্যবহার করে একটি পূর্ণাঙ্গ ব্রাউজার এজেন্ট তৈরি করে, তা ব্যাখ্যা করার মাধ্যমে ব্রাউজিংয়ের ভবিষ্যতের দিকে এক নজর দেখা।

নতুন ব্রাউজিং অভিজ্ঞতা তৈরি করতে এবং ব্রাউজারটিকে আরও সহায়ক করে তুলতে ক্লাউডে অথবা ক্রোম এক্সটেনশনের মাধ্যমে ব্রাউজারে জেমিনি ব্যবহারের সম্ভাবনা অন্বেষণ করুন।

বাস্তব জগতে ওয়েব এআই-এর ব্যবহার এবং কৌশলসমূহ

ইউরিকো হিরোটা
Yuriko Hirota
শ্বেতা গোপালকৃষ্ণান
Swetha Gopalakrishnan

ইউরিকো হিরোটা এবং শ্বেতা গোপালকৃষ্ণন এমন কিছু কোম্পানির বাস্তব উদাহরণ তুলে ধরেছেন, যারা তাদের ব্যবসা এবং ব্যবহারকারীর অভিজ্ঞতা উন্নত করতে ওয়েবে এআই ব্যবহার করছে। তাদের সমাধানটি ক্লায়েন্ট-সাইড মডেল, সার্ভার-সাইড, বা একটি হাইব্রিড সমাধান ব্যবহার করুক না কেন, আসল বিষয় হলো সেই আকর্ষণীয় নতুন ফাংশন এবং ফিচারগুলো, যা আপনি আপনার ব্যবহারকারীদের জন্য এই মুহূর্তে উপলব্ধ করছেন।

বিলিবিলি একটি নতুন ফিচারের মাধ্যমে তাদের ভিডিও স্ট্রিমগুলোকে আরও আকর্ষণীয় করে তুলেছে: বুলেট-স্ক্রিন কমেন্টস । তারা ভিডিওর মধ্যেই বক্তার পেছনে রিয়েল-টাইম ইউজার কমেন্ট দেখানোর সুযোগ দেয়। এটি করার জন্য, তারা ইমেজ সেগমেন্টেশন ব্যবহার করে, যা মেশিন লার্নিং-এর একটি সুপরিচিত ধারণা। এর ফলে, সেশনের সময়কাল ৩০% বৃদ্ধি পেয়েছে! টোকোপিডিয়া আপলোড করা ছবির মান যাচাই করার জন্য একটি ফেস ডিটেকশন মডেল ব্যবহার করে তাদের বিক্রেতা যাচাইকরণ প্রক্রিয়ার জটিলতা কমিয়েছে। এর ফলে, তারা ম্যানুয়াল অনুমোদনের হার প্রায় ৭০% কমিয়েছে।

সেরিব্রাল ভিজ্যুয়াল ইমপেয়ারমেন্ট (CVI) আক্রান্ত শিশুদের জন্য ভিশন ন্যানি একটি ওয়েব প্ল্যাটফর্ম, যা কৃত্রিম বুদ্ধিমত্তা (AI) চালিত দৃষ্টি উদ্দীপনা কার্যক্রম প্রদান করে। তারা হ্যান্ড ল্যান্ডমার্ক ডিটেকশন মডেল সহ একাধিক মিডিয়াপাইপ লাইব্রেরি ব্যবহার করে, যা একটি ছবি, ভিডিও বা রিয়েল-টাইমে হাতের গুরুত্বপূর্ণ পয়েন্টগুলো শনাক্ত করে। ৫০ জন শিশুকে নিয়ে করা একটি পাইলট পরীক্ষায় দেখা গেছে যে, ভিশন ন্যানি ম্যানুয়াল ভিজ্যুয়াল স্টিমুলেশন কার্যক্রমের চেয়ে ৫ গুণ দ্রুত প্রতিক্রিয়া প্রদান করে। থেরাপিস্টরা জানিয়েছেন যে, ম্যানুয়াল সেটআপের প্রয়োজনীয়তা দূর হওয়ায় তারা প্রতি সেশনে গড়ে তিন ঘণ্টা সময় বাঁচাতে পেরেছেন।

গুগল মিটে এআই-চালিত বেশ কিছু ফিচার রয়েছে, যেমন আলোর মান উন্নত করা থেকে শুরু করে ভিডিওর ঝাপসা ও অস্পষ্ট ভাব কমানো। সবচেয়ে বড় চ্যালেঞ্জ হলো এই ফিচারগুলোকে রিয়েল-টাইমে কাজ করতে হয়। এখানেই ওয়েবঅ্যাসেম্বলি (Wasm)-এর ভূমিকা, যা কম্পিউটারের সিপিইউ-এর সম্পূর্ণ শক্তিকে কাজে লাগিয়ে রিয়েল-টাইম ভিডিও প্রসেসিং সক্ষম করে।

এগুলো ওয়েবে কৃত্রিম বুদ্ধিমত্তার ব্যবহারের কয়েকটি বাস্তব উদাহরণ মাত্র। আরও বেশ কিছু কোম্পানি তাদের অন্তর্নির্মিত এআই এপিআই নিয়ে পরীক্ষা-নিরীক্ষা করেছে, যাদের মধ্যে কয়েকটি কেস স্টাডির মাধ্যমে তাদের কাজ তুলে ধরেছে।

ভবিষ্যতের আরও স্মার্ট ব্যবহারকারীর অভিজ্ঞতা তৈরির জন্য ক্লায়েন্ট-সাইড ওয়েব এআই এজেন্ট

জেসন মেস ইন্টারনেটের ভবিষ্যৎ—ওয়েব এআই এজেন্ট—সম্পর্কে বিস্তারিত আলোচনা করেছেন। ওয়েবের একটি এজেন্টকেন্দ্রিক ভবিষ্যৎ রয়েছে, যা বৃহৎ ভাষা মডেলের (এলএলএম) ক্ষমতার বাইরে গিয়ে আপনার হয়ে দরকারি কাজ সম্পাদনের জন্য সরাসরি ব্রাউজারে এআই সক্ষমতা নিয়ে আসবে।

ক্লায়েন্ট-সাইড পদ্ধতির মাধ্যমে উন্নত গোপনীয়তা, কম ল্যাটেন্সি এবং উল্লেখযোগ্য পরিমাণ খরচ সাশ্রয়ের সম্ভাবনা থাকে। এজেন্ট আপনাকে আপনার বিদ্যমান ওয়েবসাইট আপগ্রেড করার সুযোগ দেয়, যা ব্যবহারকারীর জন্য স্বয়ংক্রিয়ভাবে বিভিন্ন কাজ সম্পাদন করতে পারে। এটি ডায়নামিকভাবে উপলব্ধ টুলগুলো নির্বাচন ও ব্যবহার করে—সম্ভবত একটি লুপের মধ্যে—এবং এর ফলে এজেন্ট জটিল বা একাধিক ধাপের কাজ সম্পন্ন করতে সক্ষম হয়।

এজেন্টরা পারেন:

  • পরিকল্পনা করুন এবং উপ-কাজগুলো ভাগ করুন , আরও জটিল সমস্যা মোকাবেলার জন্য বহু-ধাপীয় পরিকল্পনা ব্যবহার করে কাজটিকে সম্পন্ন করার জন্য যৌক্তিক ধাপে বিভক্ত করুন।
  • অগমেন্টেড ল্যাঙ্গুয়েজ মডেলের মৌলিক জ্ঞানের জন্য ফাংশন, এপিআই ব্যবহার বা ডেটাস্টোর অ্যাক্সেসের মতো সেরা টুলগুলো নির্বাচন করুন , তারপর বহির্জগতে কার্যক্রম সম্পাদন করুন।
  • এজেন্ট বা বাহ্যিক টুল থেকে প্রাপ্ত পূর্ববর্তী আউটপুটের উপর ভিত্তি করে প্রসঙ্গ-ভিত্তিক স্মৃতি ধরে রাখুন । স্বল্পমেয়াদী স্মৃতি মডেলের প্রসঙ্গ উইন্ডোর আকার পর্যন্ত প্রসঙ্গের ইতিহাসের একটি FIFO বাফারের মতো কাজ করে, অন্যদিকে দীর্ঘমেয়াদী স্মৃতিতে একটি ভেক্টর ডেটাবেস ব্যবহার করে পূর্ববর্তী কথোপকথন সেশন বা সম্পূর্ণ ভিন্ন ডেটা উৎস থেকে প্রয়োজন অনুযায়ী তথ্য পুনরুদ্ধারের জন্য সংরক্ষণ করা যায়।

ওয়েব এআই এজেন্টগুলোকে জাভাস্ক্রিপ্টে বিদ্যমান ওয়েব প্রযুক্তির সাথে একীভূত করার জন্য ডিজাইন করা হয়েছে। পরিশেষে, ব্রাউজারে মডেলগুলোকে সর্বোত্তমভাবে চালানোর জন্য আমাদের হার্ডওয়্যারের গতি বাড়ানো অব্যাহত রাখা গুরুত্বপূর্ণ। ভবিষ্যতের দিকে তাকালে, সিপিইউ, জিপিইউ এবং এনপিইউ জুড়ে মডেলের কার্যকারিতা অপ্টিমাইজ করার ক্ষেত্রে WebNN-এর মতো প্রযুক্তি একটি মূল ভূমিকা পালন করবে। ছোট আকারের এলএলএম-এর দিকে প্রবণতা এবং ক্রমাগত অগ্রগতির সাথে, ভবিষ্যতে এটি আরও শক্তিশালী হয়ে উঠবে।

একটি হাইব্রিড পদ্ধতি ব্যবহারের কথা বিবেচনা করুন, যেখানে অন-ডিভাইস প্রসেসিংয়ের সাথে কৌশলগত ক্লাউড কলগুলোকে একত্রিত করা হবে, যাতে আপনি এখনই ব্রাউজারে বুদ্ধিমান, রেসপন্সিভ এবং ব্যক্তিগতকৃত ব্যবহারকারীর অভিজ্ঞতা তৈরি করতে পারেন। শীঘ্রই, ওয়েব এআই পদ্ধতিতে আপনার বিনিয়োগের সুফল পাওয়া যাবে, কারণ ডিভাইসগুলো এলএলএম (LLM) চালাতে আরও বেশি সক্ষম হয়ে উঠবে।

গুগল আই/ও ২০২৫ সম্পর্কে জেনে নিন।

আমরা গুগল আই/ও ২০২৫-এর সমস্ত আলোচনা প্রকাশ করেছি, সাথে ওয়েব ডেভেলপারদের জন্য একটি বিশেষ প্লেলিস্টও রয়েছে। io.google/2025- এ আরও দেখুন।