আমাদের AI ইন অ্যাকশন ওয়ার্কশপের হাইলাইট

দামানি ব্রাউন
Damani Brown
মেলিসা মিচেল
Melissa Mitchell
মারি ভিয়ানা
Mari Viana

প্রকাশিত: ১৪ অক্টোবর, ২০২৫

নিউ ইয়র্ক সিটিতে একদল স্টার্টআপের সাথে অংশীদারিত্বে, আমরা একটি "এআই ইন অ্যাকশন" প্রযুক্তিগত কর্মশালার আয়োজন করেছি। লক্ষ্য ছিল সহজ: ক্লায়েন্ট-সাইড এআই এবং বিল্ট-ইন এআই এপিআইগুলিকে কীভাবে আরও গতি, গোপনীয়তা এবং আরও ভাল ব্যবহারকারীর অভিজ্ঞতার জন্য তাদের পণ্যগুলিতে সরাসরি সংহত করা যেতে পারে তা প্রদর্শন করা।

মোট, আমরা ৮টি উদ্ভাবনী স্টার্টআপের ২৪ জন ডেভেলপারকে আতিথেয়তা দিয়েছিলাম। সকালের অধিবেশনে পণ্য এবং প্রকৌশল বিশেষজ্ঞদের আলোচনা ছিল, যেখানে ওপেন সোর্স, অন-ডিভাইস মডেলের অপার সম্ভাবনা এবং ওয়েব প্ল্যাটফর্মে সরাসরি AI আনার কৌশলগত গুরুত্ব নিয়ে আলোচনা করা হয়েছিল। এরপর কারিগরি বিশেষজ্ঞরা বিল্ট-ইন AI API দিয়ে শুরু করার জন্য ব্যবহারিক নির্দেশনা প্রদান করেছিলেন।

অংশগ্রহণকারীরা ইভেন্টটিকে অত্যন্ত মূল্যবান বলে মনে করেছেন, কারণ তাদের বিদ্যমান মেশিন লার্নিং জ্ঞান নির্বিশেষে এই API গুলি ব্যবহার করা সহজ ছিল। তারা পরীক্ষা-নিরীক্ষার মাধ্যমে তাদের অ্যাপ্লিকেশনগুলির জন্য নতুন ব্যবহারের কেসও আবিষ্কার করেছেন। আমরা আমাদের ডকুমেন্টেশন যাচাই করতে পেরে উত্তেজিত। এমনকি একটি গ্রুপ আমাদের একটি জটিল বাগ সনাক্ত করতে এবং পুনরুত্পাদন করতে সহায়তা করেছে, যাতে আমরা একটি সমাধান জমা দিতে পারি।

আমাদের অংশগ্রহণকারীরা ক্লায়েন্ট-সাইড এআই ব্যবহার করে ১০টি প্রোটোটাইপ সফলভাবে তৈরি করেছেন। তাদের কিছু প্রকল্প দেখুন এবং ইভেন্টে তাদের অভিজ্ঞতা সম্পর্কে জানুন।

প্রম্পট API ব্যবহার করে অ্যাডাপ্টারের ইভেন্ট সনাক্তকরণ

অ্যাডাপ্টারের লক্ষ্য হল "আমাদের দৈনন্দিন জীবনের জন্য মিশন কন্ট্রোল তৈরি করা যাতে স্ক্রিন-টাইম নয় বরং সর্বাধিক ফ্রি-টাইম সক্ষম করা যায়।" তারা দুটি ক্ষমতা সহ একটি প্রুফ-অফ-কনসেপ্ট এক্সটেনশন তৈরি করেছে:

  • বুদ্ধিমান এবং সারিবদ্ধ ইভেন্ট সনাক্তকরণ যা ব্রাউজ করার সময় একটি ওয়েব পৃষ্ঠার মধ্যে ইভেন্টগুলি সনাক্ত করে (কনসার্ট, রেস্তোরাঁ, ইভেন্ট) তারপর ব্যক্তিগত ক্যালেন্ডারের প্রাপ্যতা, জীবনের পছন্দ এবং রিয়েল-টাইম সামাজিক সংকেত সহ ব্যক্তিগত প্রসঙ্গের সাথে খাপ খাইয়ে নেয়, যা সমস্ত স্থানীয়ভাবে প্রক্রিয়াজাত করা হয়।
  • রিয়েল-টাইম কন্টেন্ট রির‍্যাঙ্কিং যা আপনার ব্যক্তিগত আগ্রহের ভিত্তিতে ওয়েব পৃষ্ঠায় কন্টেন্টের ক্রমকে ব্যক্তিগতকৃত করে।

অ্যাডাপ্টার পার্সিং, রিজনিং এবং কলিং টুলের জন্য প্রম্পট API এবং স্থানীয় টেক্সট জেনারেশনের জন্য রাইটার API ব্যবহার করত।

"আমরা সীমিত গোপনীয়তা বিনিময়ের মাধ্যমে জটিল যুক্তি এবং বহু-পদক্ষেপের কর্মপ্রবাহগুলি প্রান্তে রেখে করছি। এটি ব্যক্তিগত গোয়েন্দা অ্যাপ্লিকেশনগুলিকে সক্ষম করে যা অবাস্তব ছিল যখন প্রতিটি অনুমানের অর্থ ছিল নেটওয়ার্ক জুড়ে ডেটা প্রেরণ করা এবং দূরবর্তী গণনাকে আরও গভীর করা।" - ডিলন পঞ্জো, অ্যাডাপ্টারের প্রতিষ্ঠাতা প্রকৌশলী

ক্রোমের অন্তর্নির্মিত AI API গুলি হালকা ওজনের মডেলগুলিকে সক্ষম করে যা স্থানীয়ভাবে ডেটা প্রক্রিয়া করে, ডিফল্টরূপে গোপনীয়তা সংরক্ষণ করে। অ্যাডাপ্টারের প্রতিষ্ঠাতা প্রকৌশলী এইডান ক্র্যাঙ্ক এবং ডিলন পঞ্জো এটিকে তাদের স্থাপত্য দর্শনের বৈধতা হিসাবে দেখেছিলেন।

"বেশিরভাগ AI এক্সটেনশন প্রেক্ষাপট ধরে রাখে এবং অন্যত্র পাঠায়," ক্র্যাঙ্ক ব্যাখ্যা করেন, যিনি অ্যাডাপ্টারে যোগদানের আগে AWS-তে বৃহৎ পরিসরে ML ইঞ্জিনিয়ারিংয়ে কাজ করেছিলেন। "Chrome-এর অন্তর্নির্মিত AI সেই মডেলটিকে উল্টে দেয়। আপনার ব্যক্তিগত ডেটা আপনার ডিভাইসে থাকে, তবুও আপনি এমন বুদ্ধিমান অভিজ্ঞতা পান যা আগে পাওয়া যেত না।"

অ্যাডাপ্টারের সহ-প্রতিষ্ঠাতা অ্যাডাম ঘেটি, যার পূর্ববর্তী কোম্পানি আয়নিক সিকিউরিটি ব্যাপকভাবে স্বায়ত্তশাসিত ডেটা-কেন্দ্রিক সুরক্ষার পথপ্রদর্শক ছিল, তিনি আরও গভীর তাৎপর্য দেখতে পান: "গোপনীয়তা এমন কোনও বৈশিষ্ট্য নয় যা আপনি যোগ করেন; এটি আপনার পছন্দের একটি আর্কিটেকচার। ক্রোমের অন্তর্নির্মিত AI সেই আর্কিটেকচারকে ব্যবহারিক করে তোলে।"

মাল্টিমোডাল সাপোর্ট এবং সমৃদ্ধ API-এর মাধ্যমে ক্রোম যখন এই ক্ষমতাগুলি প্রসারিত করছে, তখন সুবিধাটি কেবল ক্লাউডের সাথে তাল মিলিয়ে চলা নয়। ব্যক্তিগত এবং ব্যক্তিগত AI-এর জন্য, এটি যেখানে যুক্তিসঙ্গত সেখানে এটিকে ছাড়িয়ে যাওয়ার বিষয়ে।

সাবলেয়ার প্রম্পট API ব্যবহার করে ছবিগুলিকে শ্রেণীবদ্ধ করে বৈচিত্র্য উন্নত করতে

সাবলেয়ার ফটোস্লাইডার নামে একটি মজাদার অ্যাপ তৈরি করেছে, যা আপনার ছবির সাথে কীভাবে ইন্টারঅ্যাক্ট করে এবং বিভিন্নতা তৈরি করে তা বিপ্লব করার জন্য ডিজাইন করা হয়েছে।

PhotoSlider ব্যবহার করার জন্য, ব্যবহারকারী একটি ছবি আপলোড করেন, অথবা একটি নতুন ছবি তোলেন এবং Analyze এ ক্লিক করেন। Prompt API এই ছবিগুলি বিশ্লেষণের জন্য মডেলের কাছে পাঠায়, মডেলকে 3টি মূল বৈশিষ্ট্য সনাক্ত করতে এবং সেই বৈশিষ্ট্যগুলিকে 1 থেকে 10 এর মান দিতে অনুরোধ করে। উদাহরণস্বরূপ, একটি বৈশিষ্ট্য "ঐতিহ্যবাহী" বা "উজ্জ্বলতা" হতে পারে।

ফ্রন্টএন্ডে, ব্যবহারকারীকে মানগুলি সামঞ্জস্য করার জন্য বা কাস্টম মান সহ নতুন বৈশিষ্ট্য প্রবর্তনের জন্য চিত্র এবং স্লাইডার উপস্থাপন করা হয়। পরিবর্তনের জন্য অনুরোধ এবং চিত্রটি সার্ভার-সাইড এআই-তে পাঠানো হয়, যাতে মাল্টিমোডাল আউটপুট ক্ষমতা সহ একটি বৃহত্তর মডেল পরিবর্তিত স্পেসিফিকেশনের উপর ভিত্তি করে একটি একেবারে নতুন চিত্র তৈরি করতে পারে। এই পুনরাবৃত্তিমূলক প্রক্রিয়াটি অবিরাম পুনরাবৃত্তি করা যেতে পারে, যতক্ষণ না আপনি আপনার আদর্শ চিত্রটি অর্জন করেন ততক্ষণ পর্যন্ত আপনাকে সম্পূর্ণ নিয়ন্ত্রণ দেয়।

সাবলেয়ারের সিইও স্কট ওয়ার্নার তার উৎসাহ প্রকাশ করেছেন: "স্থানীয় অনুমান কেমন তা অন্বেষণ করতে আমরা সত্যিই আগ্রহী। আমাদের ব্যবহারকারীদের মেশিনে ডিফল্টরূপে ব্রাউজারে এটি সহজেই উপলব্ধ থাকা, সরাসরি মডেল ইনস্টল করার জটিলতাগুলি নেভিগেট করার জন্য ব্যবহারকারীদের উপর নির্ভর করার চেয়ে অসীমভাবে সহজ।"

Echo3D 3D মডেলগুলিকে সমৃদ্ধ অনুসন্ধানযোগ্য ডেটাতে প্রক্রিয়াজাত করে

Echo3D বিভিন্ন দল এবং প্রতিষ্ঠানের মধ্যে 3D মডেল এবং স্ক্যানগুলি নির্বিঘ্নে সংরক্ষণ, সুরক্ষিত এবং ভাগ করে নেওয়ার জন্য উদ্যোগগুলিকে একটি প্ল্যাটফর্ম এবং API প্রদান করে। তাদের উন্নত 3D এবং টেক্সট পাইপলাইনগুলি দক্ষতার সাথে 3D মডেলগুলিকে সমৃদ্ধ, অনুসন্ধানযোগ্য ডেটাতে প্রক্রিয়া করে।

অনুষ্ঠানে, echo3D 3D-থেকে-টেক্সট-থেকে-3D সরঞ্জাম তৈরি করেছে যা সম্পদের ভিজ্যুয়াল বোধগম্যতা উন্নত করে। তারা মডেল ট্যাগিং স্বয়ংক্রিয় করতে, ডুপ্লিকেশন সনাক্ত করতে এবং বিস্তৃত 3D লাইব্রেরির ক্যাটালগিং এবং ডকুমেন্টেশনকে স্ট্রিমলাইন করতে প্রম্পট API ব্যবহার করে।

{
  "description": "A 3D model of a large, tan-colored sandcastle with one main
    tower, four small towers, and staircases wrapping around. The towers
    have multiple windows. There is a main gate.",
  "tags": ["sand","castle","gate","tan","tower","staircase"]
}

এটি প্রতিটি সম্পদকে একটি সমৃদ্ধ, সামঞ্জস্যপূর্ণ এবং অনুসন্ধানযোগ্য বর্ণনা দেয়, যার ফলে ব্যবহারকারীর সম্পূর্ণ লাইব্রেরি আরও সুসংগঠিত এবং অ্যাক্সেসযোগ্য হয়ে ওঠে। তদুপরি, এটি স্টোরেজ স্পেস সাশ্রয় করে এবং অপ্রয়োজনীয় ফাইলগুলির কারণে সৃষ্ট সংস্করণ দ্বন্দ্ব প্রতিরোধ করে।

"আমাদের দল এই অনুষ্ঠানটিকে সত্যিই মূল্যবান বলে মনে করেছে। বিল্ট-ইন এআই ব্যবহার করে ওয়েব অ্যাপ্লিকেশনগুলিতে এআই বৈশিষ্ট্যগুলি যে সহজে একীভূত করা যায় তা দেখে আমরা বিশেষভাবে মুগ্ধ হয়েছি। এত অল্প সময়ের মধ্যে সুরক্ষিত, ক্লায়েন্ট-সাইড এআই বৈশিষ্ট্যগুলি প্রোটোটাইপ এবং স্থাপন করার ক্ষমতা ছিল একটি উল্লেখযোগ্য সুবিধা।" - অ্যালন গ্রিনশপুন , ইকো3ডি- এর সিইও

Spot2 আপলোড করা ছবি থেকে স্ট্রাকচার্ড মেটাডেটা তৈরি করেছে

Spot2- এর অ্যাপ্লিকেশনটিতে মেক্সিকো সিটিতে ভাড়ার জন্য রিয়েল এস্টেট সম্পত্তির তালিকা রয়েছে। প্রায়শই যখন এই সম্পত্তিগুলি তালিকাভুক্ত করা হয়, তখন তালিকা থেকে গুরুত্বপূর্ণ মেটাডেটা এবং অন্যান্য মূল্যবান তথ্য অনুপস্থিত থাকে। সরবরাহকারীর বিশদের উপর মনোযোগের উপর নির্ভর করে বিশদগুলি অত্যন্ত পরিবর্তনশীল। Spot2 প্রম্পট API-এর মাধ্যমে ডেটার মান উন্নত করার জন্য দিনটি ব্যয় করেছে।

তাদের দল তালিকার মেটাডেটা কীভাবে গঠন করা হয় তা স্বয়ংক্রিয়ভাবে প্রক্রিয়া এবং সংগঠিত করার জন্য একটি বৈশিষ্ট্য তৈরি করেছে। এই প্রক্রিয়াটি একটি ছবি আপলোড হওয়ার মুহুর্তে ঘটে, যা সম্পূর্ণতা এবং ধারাবাহিকতা বজায় রাখতে সহায়তা করে। সার্ভার-সাইডের পরিবর্তে ক্লায়েন্ট-সাইড এই কাজটি সম্পাদন করে, বৈশিষ্ট্যটি সাশ্রয়ী।

যদি চালু করা হয়, তাহলে এই বৈশিষ্ট্যটি দ্বৈত প্রভাবের প্রতিশ্রুতি দেয়: ডেটা মানের উল্লেখযোগ্য উন্নতি এবং পরিচালন ব্যয়ে লক্ষণীয় হ্রাস। "আমরা আশা করি যে উচ্চমানের তালিকাগুলি রূপান্তর হার বৃদ্ধিতেও অনুবাদ করবে।"

পরের বার আমাদের সাথে যোগ দিন।