पहले से मौजूद एआई की मदद से, भाषा की पहचान करने की सुविधा

पब्लिश करने की तारीख: 24 सितंबर, 2024, पिछली बार अपडेट करने की तारीख: 20 मई, 2025

Browser Support

  • Chrome: 138.
  • Edge: not supported.
  • Firefox: not supported.
  • Safari: not supported.

Source

किसी टेक्स्ट का एक भाषा से दूसरी भाषा में अनुवाद करने से पहले, आपको यह पता लगाना होगा कि दिए गए टेक्स्ट में कौनसी भाषा इस्तेमाल की गई है. पहले, अनुवाद करने के लिए टेक्स्ट को क्लाउड सेवा पर अपलोड करना पड़ता था. इसके बाद, सर्वर पर अनुवाद किया जाता था और फिर नतीजे डाउनलोड किए जाते थे.

Language Detector API, क्लाइंट-साइड पर काम करता है. इसका मतलब है कि आपके पास उपयोगकर्ता की निजता को सुरक्षित रखने का विकल्प होता है. हालांकि, ऐसी लाइब्रेरी को शिप किया जा सकता है जो ऐसा करती है. हालांकि, इसे डाउनलोड करने के लिए अतिरिक्त संसाधनों की ज़रूरत होगी.

भाषा का पता लगाने की सुविधा का इस्तेमाल कब करना चाहिए

भाषा का पता लगाने वाला एपीआई, मुख्य तौर पर इन स्थितियों में काम आता है:

  • इनपुट किए गए टेक्स्ट की भाषा का पता लगाता है, ताकि उसका अनुवाद किया जा सके.
  • इनपुट टेक्स्ट की भाषा का पता लगाना, ताकि भाषा के हिसाब से टास्क के लिए सही मॉडल लोड किया जा सके. जैसे, बुरे बर्ताव का पता लगाना.
  • इनपुट किए गए टेक्स्ट की भाषा का पता लगाना, ताकि उसे सही तरीके से लेबल किया जा सके. उदाहरण के लिए, ऑनलाइन सोशल नेटवर्किंग साइटों पर.
  • इनपुट किए गए टेक्स्ट की भाषा का पता लगाना, ताकि ऐप्लिकेशन के इंटरफ़ेस को उसके हिसाब से अडजस्ट किया जा सके. उदाहरण के लिए, बेल्जियम की किसी साइट पर सिर्फ़ उन उपयोगकर्ताओं को इंटरफ़ेस दिखाना जो फ़्रेंच भाषा बोलते हैं.

अपनी प्रोफ़ाइल बनाना शुरू करें

यह देखने के लिए कि ब्राउज़र, Language Detector API के साथ काम करता है या नहीं, सुविधा की पहचान करने की प्रोसेस चलाएं.

if ('LanguageDetector' in self) {
  // The Language Detector API is available.
}

मॉडल डाउनलोड

भाषा की पहचान करने की सुविधा, एक ऐसे मॉडल पर काम करती है जिसे भाषाओं की पहचान करने के खास टास्क के लिए फ़ाइन-ट्यून किया गया है. एपीआई को ब्राउज़र में बनाया गया है. हालांकि, मॉडल को पहली बार किसी साइट के एपीआई का इस्तेमाल करने की कोशिश करने पर, मांग पर डाउनलोड किया जाता है. Chrome में, यह मॉडल अन्य मॉडल की तुलना में बहुत छोटा है. ऐसा हो सकता है कि यह पहले से मौजूद हो, क्योंकि इस मॉडल का इस्तेमाल Chrome की अन्य सुविधाएं करती हैं.

यह पता लगाने के लिए कि मॉडल इस्तेमाल करने के लिए तैयार है या नहीं, एसिंक्रोनस LanguageDetector.availability() फ़ंक्शन को कॉल करें. अगर availability() का जवाब downloadable था, तो डाउनलोड होने की प्रोसेस के बारे में सुनो और उपयोगकर्ता को इसकी जानकारी दो. ऐसा इसलिए, क्योंकि डाउनलोड होने में समय लग सकता है.

भाषा का पता लगाने वाले टूल को डाउनलोड करने और उसे इंस्टैंटिएट करने के लिए, उपयोगकर्ता के ऐक्टिवेशन की जांच करें. इसके बाद, एसिंक्रोनस LanguageDetector.create() फ़ंक्शन को कॉल करें.

const detector = await LanguageDetector.create({
  monitor(m) {
    m.addEventListener('downloadprogress', (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});

भाषा की पहचान करने वाले टूल को चलाना

Language Detector API, रैंकिंग मॉडल का इस्तेमाल करके यह पता लगाता है कि दिए गए टेक्स्ट में किस भाषा का इस्तेमाल किया गया है. रैंकिंग, मशीन लर्निंग का एक टाइप है. इसका मकसद, आइटम की सूची को क्रम से लगाना है. इस मामले में, Language Detector API, भाषाओं को सबसे ज़्यादा से सबसे कम संभावना के हिसाब से रैंक करता है.

detect() फ़ंक्शन, पहला नतीजा, सबसे सही जवाब या कॉन्फ़िडेंस लेवल के साथ रैंक किए गए उम्मीदवारों को दोहरा सकता है. यह {detectedLanguage, confidence} ऑब्जेक्ट की सूची के तौर पर दिखता है. confidence लेवल को 0.0 (सबसे कम कॉन्फ़िडेंस) और 1.0 (सबसे ज़्यादा कॉन्फ़िडेंस) के बीच की वैल्यू के तौर पर दिखाया जाता है.

const someUserText = 'Hallo und herzlich willkommen!';
const results = await detector.detect(someUserText);
for (const result of results) {
  // Show the full list of potential languages with their likelihood, ranked
  // from most likely to least likely. In practice, one would pick the top
  // language(s) that cross a high enough threshold.
  console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...

एपीआई प्लेग्राउंड

हमारे एपीआई प्लेग्राउंड में, Language Detector API को आज़माएं. टेक्स्ट एरिया में अलग-अलग भाषाओं में लिखा गया टेक्स्ट डालें.

अनुमतियों की नीति, iframe, और वेब वर्कर

डिफ़ॉल्ट रूप से, Language Detector API सिर्फ़ टॉप-लेवल की विंडो और उनके एक ही ऑरिजिन वाले iframe के लिए उपलब्ध होता है. एपीआई का ऐक्सेस, क्रॉस-ऑरिजिन iframe को सौंपा जा सकता है. इसके लिए, अनुमति से जुड़ी नीति allow="" एट्रिब्यूट का इस्तेमाल करें:

<!--
  The hosting site at https://main.example.com can grant a cross-origin iframe
  at https://cross-origin.example.com/ access to the Language Detector API by
  setting the `allow="language-detector"` attribute.
-->
<iframe src="https://cross-origin.example.com/" allow="language-detector"></iframe>

Language Detector API, वेब वर्कर में उपलब्ध नहीं है. ऐसा इसलिए है, क्योंकि हर वर्कर के लिए एक ज़िम्मेदार दस्तावेज़ तैयार करना मुश्किल है, ताकि अनुमतियों से जुड़ी नीति की स्थिति की जांच की जा सके.

सुझाव/राय दें या शिकायत करें

हमें यह देखना है कि Language Detector API का इस्तेमाल करके, क्या बनाया जा रहा है. अपनी वेबसाइटों और वेब ऐप्लिकेशन को X, YouTube, और LinkedIn पर हमारे साथ शेयर करें.

अगर आपको Chrome में इस सुविधा को लागू करने के बारे में कोई सुझाव, शिकायत या राय देनी है, तो Chromium बग फ़ाइल करें.