पब्लिश होने की तारीख: 14 अक्टूबर, 2025

हमने न्यूयॉर्क शहर में स्टार्टअप के एक ग्रुप के साथ मिलकर, "एआई इन ऐक्शन" टेक्निकल वर्कशॉप को होस्ट किया. इसका मकसद यह दिखाना था कि क्लाइंट-साइड एआई और बिल्ट-इन एआई एपीआई को सीधे तौर पर उनके प्रॉडक्ट में कैसे इंटिग्रेट किया जा सकता है. इससे, बेहतर स्पीड, निजता, और उपयोगकर्ता अनुभव मिलता है.
हमने कुल 24 डेवलपर को होस्ट किया. ये डेवलपर, आठ नई सोच वाली स्टार्टअप कंपनियों से थे. सुबह के सेशन में, प्रॉडक्ट और इंजीनियरिंग के विशेषज्ञों ने बातचीत की. इसमें ओपन सोर्स, डिवाइस पर मौजूद मॉडल की अपार संभावनाओं के बारे में बताया गया. साथ ही, एआई को सीधे तौर पर वेब प्लैटफ़ॉर्म पर लाने के रणनीतिक महत्व के बारे में भी बताया गया. इसके बाद, तकनीकी विशेषज्ञों ने बिल्ट-इन एआई एपीआई का इस्तेमाल शुरू करने के लिए, व्यावहारिक सुझाव दिए.
मीटिंग में शामिल होने वाले लोगों को यह इवेंट बहुत काम का लगा. उन्हें पता चला कि मशीन लर्निंग के बारे में पहले से जानकारी न होने के बावजूद, इन एपीआई का इस्तेमाल करना आसान है. उन्होंने एक्सपेरिमेंट के ज़रिए, अपने ऐप्लिकेशन के इस्तेमाल के नए उदाहरण भी खोजे. हमें अपने दस्तावेज़ों की पुष्टि करने में बहुत खुशी हुई. एक ग्रुप ने हमें एक जटिल गड़बड़ी की पहचान करने और उसे ठीक करने में मदद की, ताकि हम उसे ठीक करने के लिए सबमिट कर सकें.
सम्मेलन में शामिल लोगों ने क्लाइंट-साइड एआई का इस्तेमाल करके, 10 प्रोटोटाइप बनाए. उनके कुछ प्रोजेक्ट देखें और इवेंट में उनके अनुभव के बारे में जानें.
Prompt API का इस्तेमाल करके, अडैप्टर के इवेंट का पता लगाना
Adapter का लक्ष्य, "हमारी रोज़मर्रा की ज़िंदगी के लिए मिशन कंट्रोल बनाना है, ताकि स्क्रीन पर कम समय बिताया जाए और ज़्यादा से ज़्यादा समय खाली रहे." उन्होंने दो सुविधाओं वाला एक कॉन्सेप्ट एक्सटेंशन बनाया:
- इंटेलिजेंट और अलाइन इवेंट डिटेक्शन की सुविधा, वेब पेज ब्राउज़ करते समय इवेंट (कॉन्सर्ट, रेस्टोरेंट, इवेंट) का पता लगाती है. इसके बाद, यह सुविधा इवेंट को निजी कॉन्टेक्स्ट के हिसाब से ढालती है. जैसे, निजी कैलेंडर की उपलब्धता, जीवन से जुड़ी प्राथमिकताएं, और रीयल-टाइम सोशल सिग्नल. इन सभी को स्थानीय तौर पर प्रोसेस किया जाता है.
- कॉन्टेंट को रीयल-टाइम में फिर से रैंक करने की सुविधा. इससे वेब पेज पर मौजूद कॉन्टेंट को आपकी निजी दिलचस्पी के हिसाब से क्रम में लगाया जाता है.
अडैप्टर ने पार्स करने, तर्क करने, और टूल को कॉल करने के लिए, Prompt API का इस्तेमाल किया. साथ ही, स्थानीय टेक्स्ट जनरेट करने के लिए, Writer API का इस्तेमाल किया.
"हम निजता से जुड़े समझौते को सीमित रखते हुए, एज पर कई चरणों में काम करने वाले वर्कफ़्लो और जटिल रीज़निंग कर रहे हैं. इससे निजी इंटेलिजेंस ऐप्लिकेशन चालू हो जाते हैं. पहले, हर अनुमान का मतलब था कि डेटा को नेटवर्क पर शिप किया जाए. साथ ही, रिमोट कंप्यूटेशन को बेहतर बनाया जाए." – डिलन पोंज़ो, Adapter के फ़ाउंडिंग इंजीनियर
Chrome में पहले से मौजूद एआई एपीआई, हल्के मॉडल को चालू करते हैं. ये मॉडल, डेटा को स्थानीय तौर पर प्रोसेस करते हैं. साथ ही, डिफ़ॉल्ट रूप से निजता बनाए रखते हैं. Adapter के फ़ाउंडिंग इंजीनियर Aidan Crank और Dillon Ponzo ने इसे अपनी आर्किटेक्चरल फ़िलॉसफ़ी की पुष्टि के तौर पर देखा.
क्रैंक बताते हैं कि "ज़्यादातर एआई एक्सटेंशन, कॉन्टेक्स्ट को कैप्चर करते हैं और उसे कहीं और भेजते हैं." क्रैंक ने Adapter में शामिल होने से पहले, AWS में बड़े पैमाने पर एमएल इंजीनियरिंग पर काम किया था. "Chrome में पहले से मौजूद एआई, उस मॉडल को उलट देता है. आपका निजी डेटा आपके डिवाइस पर ही रहता है. हालांकि, आपको पहले से ज़्यादा बेहतर अनुभव मिलता है."
Adapter के सह-संस्थापक एडम गेट्टी का मानना है कि निजता की सुरक्षा के लिए, डेटा को सुरक्षित रखने के तरीके को बड़े पैमाने पर लागू करना ज़रूरी है. उनकी पिछली कंपनी Ionic Security ने इस दिशा में काफ़ी काम किया है. उनका कहना है कि "निजता कोई ऐसी सुविधा नहीं है जिसे जोड़ा जा सकता है. यह एक ऐसा आर्किटेक्चर है जिसे चुना जाता है. Chrome में पहले से मौजूद एआई की वजह से, यह आर्किटेक्चर काम कर पाता है."
Chrome, मल्टीमॉडल सपोर्ट और बेहतर एपीआई के साथ इन सुविधाओं को बेहतर बना रहा है. इसलिए, एज सिर्फ़ क्लाउड के साथ तालमेल नहीं बिठा रहा है. निजी और प्राइवेट एआई के लिए, यह ज़रूरी है कि एआई को उन मामलों में बेहतर बनाया जाए जहां इसकी ज़रूरत है.
सबलेयर, प्रॉम्प्ट एपीआई की मदद से इमेज को कैटगरी में बांटता है, ताकि अलग-अलग तरह की इमेज को बेहतर बनाया जा सके
Sublayer ने Photoslider नाम का एक मज़ेदार ऐप्लिकेशन बनाया है. इसे इस तरह से डिज़ाइन किया गया है कि आप अपनी इमेज के साथ इंटरैक्ट करने और उनके अलग-अलग वर्शन जनरेट करने के तरीके में बदलाव कर सकें.
PhotoSlider का इस्तेमाल करने के लिए, उपयोगकर्ता कोई फ़ोटो अपलोड करता है या नई फ़ोटो कैप्चर करता है. इसके बाद, वह विश्लेषण करें पर क्लिक करता है. Prompt API, इन इमेज को विश्लेषण के लिए मॉडल को भेजता है. साथ ही, मॉडल से तीन मुख्य एट्रिब्यूट की पहचान करने और उन्हें 1 से 10 तक की वैल्यू देने का अनुरोध करता है. उदाहरण के लिए, कोई एट्रिब्यूट "पारंपरिक" या "चमक" हो सकता है.
फ़्रंटएंड पर, उपयोगकर्ता को इमेज और स्लाइडर दिखाए जाते हैं. इनकी मदद से, वह वैल्यू में बदलाव कर सकता है या कस्टम वैल्यू वाले नए एट्रिब्यूट जोड़ सकता है. बदलाव करने के अनुरोध और इमेज को सर्वर-साइड एआई को भेजा जाता है, ताकि मल्टीमॉडल आउटपुट की सुविधाओं वाला बड़ा मॉडल, बदली गई खास बातों के आधार पर बिलकुल नई इमेज जनरेट कर सके. इस प्रोसेस को बार-बार दोहराया जा सकता है. इससे आपको अपनी पसंद के मुताबिक इमेज मिलने तक, पूरा कंट्रोल मिलता है.
Sublayer के सीईओ, स्कॉट वर्नर ने इस बारे में कहा, "हमें यह जानने में दिलचस्पी थी कि लोकल इन्फ़रेंस कैसा दिखता है. इसे डिफ़ॉल्ट रूप से, हमारे उपयोगकर्ताओं के ब्राउज़र में उपलब्ध कराना, सीधे तौर पर मॉडल इंस्टॉल करने की जटिलताओं को नेविगेट करने के लिए उपयोगकर्ताओं पर भरोसा करने की तुलना में बहुत आसान है."
Echo3D, 3D मॉडल को खोजे जा सकने वाले ज़्यादा बेहतर डेटा में बदलता है

Echo3D, कंपनियों को एक प्लैटफ़ॉर्म और एपीआई उपलब्ध कराता है. इसकी मदद से, कंपनियां अलग-अलग टीमों और संगठनों के साथ 3D मॉडल और स्कैन को आसानी से सेव, सुरक्षित, और शेयर कर सकती हैं. इनकी बेहतर 3D और टेक्स्ट पाइपलाइन, 3D मॉडल को खोजे जा सकने वाले डेटा में बदल देती हैं.
इस इवेंट में, echo3D ने 3D से टेक्स्ट और टेक्स्ट से 3D में बदलने वाले टूल बनाए. इनसे ऐसेट को विज़ुअल तौर पर समझने में मदद मिलती है. उन्होंने Prompt API का इस्तेमाल करके, मॉडल टैग करने की प्रोसेस को अपने-आप होने के लिए सेट किया. साथ ही, डुप्लीकेट मॉडल का पता लगाया. इसके अलावा, उन्होंने 3D मॉडल की बड़ी लाइब्रेरी की कैटलॉगिंग और दस्तावेज़ बनाने की प्रोसेस को आसान बनाया.
{
"description": "A 3D model of a large, tan-colored sandcastle with one main
tower, four small towers, and staircases wrapping around. The towers
have multiple windows. There is a main gate.",
"tags": ["sand","castle","gate","tan","tower","staircase"]
}
इससे हर ऐसेट को बेहतर, एक जैसी, और खोजे जा सकने वाली जानकारी मिलती है. इस तरह, उपयोगकर्ता की पूरी लाइब्रेरी ज़्यादा व्यवस्थित और ऐक्सेस करने में आसान हो जाती है. इसके अलावा, इससे स्टोरेज की जगह बचती है और एक जैसी फ़ाइलों की वजह से वर्शन में होने वाले टकराव को रोका जा सकता है.
"हमारी टीम को यह इवेंट बहुत पसंद आया. हम खास तौर पर इस बात से काफ़ी प्रभावित हुए कि एआई की सुविधाओं को, वेब ऐप्लिकेशन में आसानी से इंटिग्रेट किया जा सकता है. इसके लिए, एआई की सुविधाओं को वेब ऐप्लिकेशन में पहले से ही शामिल किया जाता है. इतने कम समय में, सुरक्षित और क्लाइंट-साइड एआई सुविधाओं का प्रोटोटाइप बनाने और उन्हें डिप्लॉय करने की क्षमता, हमारे लिए काफ़ी फ़ायदेमंद साबित हुई." – एलन ग्रिनस्पून, सीईओ, echo3D
Spot2 ने अपलोड की गई इमेज से स्ट्रक्चर्ड मेटाडेटा बनाया
Spot2 के ऐप्लिकेशन में, मेक्सिको सिटी में किराए पर उपलब्ध रीयल एस्टेट प्रॉपर्टी की सूची दी गई है. अक्सर इन प्रॉपर्टी को लिस्ट करते समय, लिस्टिंग में ज़रूरी मेटाडेटा और अन्य अहम जानकारी मौजूद नहीं होती. यह जानकारी अलग-अलग हो सकती है. यह इस बात पर निर्भर करती है कि सप्लायर ने कितनी बारीकी से जानकारी दी है. Spot2 ने Prompt API की मदद से, डेटा क्वालिटी को बेहतर बनाने में पूरा दिन बिताया.
उनकी टीम ने एक ऐसी सुविधा डेवलप की है जो लिस्टिंग के मेटाडेटा को अपने-आप प्रोसेस करती है और उसे व्यवस्थित करती है. यह प्रोसेस, फ़ोटो अपलोड होते ही शुरू हो जाती है. इससे फ़ोटो में पूरी जानकारी और एक जैसी क्वालिटी बनी रहती है. इस टास्क को सर्वर-साइड के बजाय क्लाइंट-साइड पर करने से, इस सुविधा का इस्तेमाल कम खर्च में किया जा सकता है.
इस सुविधा को लॉन्च करने से, दो तरह के फ़ायदे मिलेंगे: डेटा की क्वालिटी में काफ़ी सुधार होगा और ऑपरेशनल खर्च में भी कमी आएगी. "हमें उम्मीद है कि बेहतर क्वालिटी वाली लिस्टिंग से कन्वर्ज़न रेट भी बढ़ेगा."
अगली बार हमसे जुड़ें
- 'एआई इन ऐक्शन' वर्कशॉप के अगले सेशन के लिए रजिस्टर करें. यह सेशन 7 नवंबर, 2025 को सैन फ़्रांसिस्को में होगा.
- साल 2025 के लिए, एआई की सुविधाओं को इस्तेमाल करने से जुड़ी चुनौती में शामिल हों. हम सभी डेवलपर के लिए, एक वर्चुअल हैकथॉन होस्ट कर रहे हैं. बिल्ट-इन एआई एपीआई का इस्तेमाल करके, वेब ऐप्लिकेशन या Chrome एक्सटेंशन बनाएं. इससे आपको 70,000 डॉलर के इनाम जीतने का मौका मिलेगा.