इस पेज का अनुवाद Cloud Translation API से किया गया है.

पहले से मौजूद एआई की मदद से, भाषा की पहचान करने की सुविधा

Thomas Steiner

पब्लिश करने की तारीख: 24 सितंबर, 2024, पिछले अपडेट की तारीख: 20 मई, 2025

Browser Support

किसी टेक्स्ट का एक भाषा से दूसरी भाषा में अनुवाद करने से पहले, आपको यह पता लगाना होगा कि दिए गए टेक्स्ट में कौनसी भाषा इस्तेमाल की गई है. पहले, अनुवाद करने के लिए टेक्स्ट को क्लाउड सेवा पर अपलोड करना पड़ता था. इसके बाद, सर्वर पर अनुवाद किया जाता था और फिर नतीजों को डाउनलोड किया जाता था.

Language Detector API, क्लाइंट-साइड पर काम करता है. इसका मतलब है कि आपके पास उपयोगकर्ता की निजता को सुरक्षित रखने का विकल्प होता है. हालांकि, ऐसी लाइब्रेरी को शिप किया जा सकता है जो ऐसा करती है. हालांकि, इसे डाउनलोड करने के लिए अतिरिक्त संसाधनों की ज़रूरत होगी.

भाषा का पता लगाने की सुविधा का इस्तेमाल कब करना चाहिए

Language Detector API, मुख्य तौर पर इन स्थितियों में काम आता है:

इनपुट किए गए टेक्स्ट की भाषा का पता लगाता है, ताकि उसका अनुवाद किया जा सके.
इनपुट किए गए टेक्स्ट की भाषा का पता लगाना, ताकि भाषा के हिसाब से टास्क पूरे करने के लिए सही मॉडल लोड किया जा सके. जैसे, बुरे बर्ताव का पता लगाना.
इनपुट टेक्स्ट की भाषा का पता लगाना, ताकि उसे सही तरीके से लेबल किया जा सके. उदाहरण के लिए, ऑनलाइन सोशल नेटवर्किंग साइटों में.
इनपुट किए गए टेक्स्ट की भाषा का पता लगाना, ताकि ऐप्लिकेशन के इंटरफ़ेस को उसके हिसाब से अडजस्ट किया जा सके. उदाहरण के लिए, बेल्जियम की किसी साइट पर सिर्फ़ उन उपयोगकर्ताओं को इंटरफ़ेस दिखाना जो फ़्रेंच बोलते हैं.

अपनी प्रोफ़ाइल बनाना शुरू करें

यह देखने के लिए कि ब्राउज़र, Language Detector API के साथ काम करता है या नहीं, सुविधा की पहचान करने की प्रोसेस चलाएं.

if ('LanguageDetector' in self) {
  // The Language Detector API is available.
}

मॉडल डाउनलोड

भाषा की पहचान करने की सुविधा, एक ऐसे मॉडल पर काम करती है जिसे भाषाओं की पहचान करने के खास टास्क के लिए फ़ाइन-ट्यून किया गया है. एपीआई को ब्राउज़र में बनाया गया है. हालांकि, मॉडल को पहली बार किसी साइट के एपीआई का इस्तेमाल करने की कोशिश करने पर, मांग पर डाउनलोड किया जाता है. Chrome में, यह मॉडल अन्य मॉडल की तुलना में बहुत छोटा है. ऐसा हो सकता है कि यह मॉडल पहले से मौजूद हो, क्योंकि इसका इस्तेमाल Chrome की अन्य सुविधाएं करती हैं.

यह पता लगाने के लिए कि मॉडल इस्तेमाल करने के लिए तैयार है या नहीं, एसिंक्रोनस LanguageDetector.availability() फ़ंक्शन को कॉल करें. अगर availability() का जवाब downloadable था, तो डाउनलोड होने की प्रोसेस के बारे में सुनो और उपयोगकर्ता को इसकी जानकारी दो. ऐसा इसलिए, क्योंकि डाउनलोड होने में समय लग सकता है.

भाषा का पता लगाने वाले टूल को डाउनलोड करने और उसे इंस्टैंटिएट करने के लिए, उपयोगकर्ता के ऐक्टिवेशन की जांच करें. इसके बाद, एसिंक्रोनस LanguageDetector.create() फ़ंक्शन को कॉल करें.

const detector = await LanguageDetector.create({
  monitor(m) {
    m.addEventListener('downloadprogress', (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});

भाषा की पहचान करने वाले टूल को चलाएं

Language Detector API, रैंकिंग मॉडल का इस्तेमाल करके यह पता लगाता है कि किसी टेक्स्ट में किस भाषा का इस्तेमाल किया गया है. रैंकिंग, मशीन लर्निंग का एक टाइप है. इसका मकसद, आइटम की सूची को क्रम से लगाना है. इस मामले में, Language Detector API, भाषाओं को सबसे ज़्यादा से सबसे कम संभावना के हिसाब से रैंक करता है.

detect() फ़ंक्शन, पहले नतीजे, सबसे सही जवाब या भरोसे के लेवल के साथ रैंक किए गए उम्मीदवारों को दोहरा सकता है. यह {detectedLanguage, confidence} ऑब्जेक्ट की सूची के तौर पर दिखता है. confidence लेवल को 0.0 (सबसे कम कॉन्फ़िडेंस) और 1.0 (सबसे ज़्यादा कॉन्फ़िडेंस) के बीच की वैल्यू के तौर पर दिखाया जाता है.

const someUserText = 'Hallo und herzlich willkommen!';
const results = await detector.detect(someUserText);
for (const result of results) {
  // Show the full list of potential languages with their likelihood, ranked
  // from most likely to least likely. In practice, one would pick the top
  // language(s) that cross a high enough threshold.
  console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...

चेतावनी: बहुत छोटे वाक्यांशों और एक शब्द का इस्तेमाल करने से बचें, क्योंकि इससे नतीजों के सटीक होने की संभावना कम हो जाती है. अगर आपको आम तौर पर छोटे टेक्स्ट पर काम करना होता है, तो अपनी प्राथमिकता वाली भाषाओं के साथ एक्सपेरिमेंट करें. साथ ही, रिपोर्ट किए गए कॉन्फ़िडेंस की समीक्षा करें. इसके अलावा, कॉन्फ़िडेंस बहुत कम होने पर, नतीजे को 'पता नहीं' के तौर पर दिखाएं.

एपीआई प्लेग्राउंड

हमारे एपीआई प्लेग्राउंड में, Language Detector API को आज़माएं. टेक्स्ट एरिया में अलग-अलग भाषाओं में लिखा गया टेक्स्ट डालें.

अनुमतियों की नीति, iframe, और वेब वर्कर

डिफ़ॉल्ट रूप से, Language Detector API सिर्फ़ टॉप-लेवल की विंडो और उनके एक ही ऑरिजिन वाले iframe के लिए उपलब्ध होता है. एपीआई का ऐक्सेस, क्रॉस-ऑरिजिन iframe को सौंपा जा सकता है. इसके लिए, अनुमति से जुड़ी नीति allow="" एट्रिब्यूट का इस्तेमाल करें:

<!--
  The hosting site at https://main.example.com can grant a cross-origin iframe
  at https://cross-origin.example.com/ access to the Language Detector API by
  setting the `allow="language-detector"` attribute.
-->
<iframe src="https://cross-origin.example.com/" allow="language-detector"></iframe>

Language Detector API, वेब वर्कर में उपलब्ध नहीं है. ऐसा इसलिए होता है, क्योंकि हर कर्मचारी के लिए एक ज़िम्मेदार दस्तावेज़ तैयार करना मुश्किल होता है, ताकि अनुमतियों से जुड़ी नीति की स्थिति की जांच की जा सके.

सुझाव/राय दें या शिकायत करें

हमें यह देखना है कि Language Detector API का इस्तेमाल करके, आपने क्या बनाया है. अपनी वेबसाइटों और वेब ऐप्लिकेशन को X, YouTube, और LinkedIn पर हमारे साथ शेयर करें.

अगर आपको Chrome में इस सुविधा को लागू करने के बारे में कोई सुझाव, शिकायत या राय देनी है, तो Chromium में गड़बड़ी की रिपोर्ट सबमिट करें.

Early Preview Program में शामिल हों. इससे आपको एआई की मदद से काम करने वाले नए एपीआई के बारे में पहले से पता चल जाएगा. साथ ही, आपको हमारी मेलिंग लिस्ट में शामिल होने का मौका मिलेगा, जहां आप इन एपीआई के बारे में चर्चा कर सकते हैं.