Opublikowano: 14 kwietnia 2026 r.
Przed pojawieniem się generatywnej AI testowanie AI było podobne do innych form testowania oprogramowania. Jeśli używasz tego samego kodu, danych i ustawień, powinieneś uzyskać ten sam wynik. Testy są powtarzalne, a algorytmy deterministyczne. Oprogramowanie jest przewidywalne, co buduje zaufanie użytkowników.
W przypadku generatywnej AI jakość staje się subiektywna, a nie obiektywna. Testowanie jest kluczowe. Dzięki testom Twój zespół może z pewnością udostępniać funkcje użytkownikom. W przypadku ocen AI (w skrócie evals) używasz nowych przepływów pracy do testowania aplikacji.
W ciągu najbliższych kilku tygodni opublikujemy lekcje dotyczące ocen AI. Zaczniemy od podstaw, czyli od wszystkiego, co jest potrzebne do skonfigurowania pierwszego potoku testowania AI. Następnie udostępnimy bardziej zaawansowane techniki, aby można było dalej iterować i ulepszać oceny.
Są to nowe techniki w szybko zmieniającym się krajobrazie AI. Chociaż możesz się spodziewać, że dokładne narzędzia się zmienią, te sprawdzone metody są trwałe.
Pierwsze 4 moduły będą dostępne 16 kwietnia 2026 r.
Zaangażuj się i prześlij opinię
Cieszysz się na ten kurs? Masz pytania lub tematy, które chcesz zobaczyć? Chętnie je poznamy. Umów się z nami na spotkanie, wyślij nam wiadomość w mediach społecznościowych: BlueSky, LinkedIn, lub X.
Dołącz do programu testowania aktualizacji aby wcześniej poznać nowe interfejsy API AI i uzyskać dostęp do naszej listy adresowej.