एआई के आकलन के बारे में हमारा कोर्स अब खत्म होने वाला है. आपने एलएलएम की दुनिया के लिए, वेब की मौजूदा टेस्टिंग से जुड़ी अपनी जानकारी का इस्तेमाल किया. साथ ही, नियम के मुताबिक यूनिट टेस्ट बनाए, जज मॉडल बनाया और उसकी जांच की. इसके अलावा, आपने टेस्टिंग पाइपलाइन को भी सेट अप किया.
हमारे उद्योग को वाइब्स और एलएलएम के नॉनडिटरमिनिज़्म के बारे में चिंता है. असल में, अगर आपने कभी ऐसा वेब ऐप्लिकेशन बनाया है जो अलग-अलग ब्राउज़र, डिवाइसों, और स्क्रीन साइज़ पर बिना किसी गड़बड़ी के काम करता है, तो आपको इसके लिए तैयार रहना होगा. एक इनपुट से कई तरह के नतीजे मिल सकते हैं. साथ ही, ऐसा एनवायरमेंट जिसे पूरी तरह से कंट्रोल नहीं किया जा सकता. इसके अलावा, "यह मेरे डिवाइस पर काम करता है" वाली समस्या भी हो सकती है.
इसका समाधान टेस्टिंग है. आकलन, एआई की सुविधाओं की टेस्टिंग ही है. वेब की टेस्टिंग से आपको अलग-अलग ब्राउज़र एनवायरमेंट में शिप करने का भरोसा मिला. इसी तरह, एआई की सुविधाओं के लिए आकलन से भी आपको भरोसा मिलेगा. आकलन करें और शिप करें!
आगे बढ़ने से पहले, खुद से कुछ अहम सवाल पूछें: किसी आउटपुट को "खराब" क्या बनाता है? गड़बड़ी की वजह बनने वाली स्थितियों के बारे में बताएं. अपने डेटा के बारे में गहराई से जानें और डोमेन के विशेषज्ञों के साथ मिलकर काम करें. किसी आउटपुट को "अच्छा" क्या बनाता है और "बेहतरीन" क्या बनाता है? किसी मॉडल से ग्रेडिंग के लिए कहने से पहले, अपनी उम्मीदों के बारे में साफ़ तौर पर बताएं. आप कितनी बार आकलन करेंगे? आकलन के हिसाब से डेवलपमेंट करना एक तरीका है. हालांकि, यह तय करें कि ऐप्लिकेशन को डिप्लॉय करने के बाद, आप कितनी बार उसका आकलन करेंगे.
एआई की दुनिया तेज़ी से बदल रही है. ऐसे में, पूरी पाइपलाइन बनाना मुश्किल हो सकता है. छोटे पैमाने पर शुरुआत करें: नियम के मुताबिक एक टेस्ट लिखें और एलएलएम का एक बुनियादी जज बनाएं. जब आपको यह पता चल जाता है, तो आपको अनुमान लगाने की ज़रूरत नहीं होती. साथ ही, इंजीनियर के तौर पर आपको अपनी क्षमता वापस मिल जाती है. आप इंटरनल प्रोटोटाइप से, एक ऐसी मज़बूत सुविधा तक पहुंच जाते हैं जिसकी टेस्टिंग की जा सकती है, जिसे मेज़र किया जा सकता है, और जिसे भरोसे के साथ शिप किया जा सकता है. ध्यान रखें कि इंसानों के बनाए गए आकलन में, इंसानों की कमियां हो सकती हैं. इसमें पूर्वाग्रह हो सकता है. पूर्वाग्रह को दूर करने के लिए, अपने मॉडल और आकलन का नियमित ऑडिट करें.
अपने पहले टेस्ट बनाने के लिए, इस कोर्स को फ़ॉलो करें. साथ ही, साथ में दिए गए कोड को देखें और टेस्टिंग शुरू करें. आपने जो सीखा है उसे शेयर करें: आपने आकलन कैसे किया? @ChromiumDev पर हमसे संपर्क करें, BlueSky पर हमारे साथ शेयर करें या Web.dev की एआई टीम के साथ, ऑफ़िस के समय के दौरान वन-ऑन-वन मीटिंग सेट अप करें.