Bu kursta kullanılan kaynakların ve size yardımcı olabilecek değerlendirme araçlarının listesi (liste tam kapsamlı değildir).
Kaynaklar
Bu seriyi yazarken aşağıdakiler de dahil olmak üzere çeşitli kaynaklardan yararlandık:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen
- De-risking QA for LLM-powered applications - Michael Hablich, Chrome DevTools
- Using LLM-as-a-Judge For Evaluation: A Complete Guide - Hamel Husain
Değerlendirme araçları
Değerlendirme çözümleri ve araçlarına örnek olarak aşağıdakiler verilebilir:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- Vertex AI'ın üretken yapay zeka değerlendirme hizmeti ve API'si
- Değerlendirmeleri İnceleme
- JudgeLM
- LangSmith
- Değerlendirme koşulu
- OpenEvals
Bu liste tam kapsamlı değildir. Başka değerlendirme araçları kullanıyorsanız bizimle paylaşın.