Unvollständige Liste der in diesem Kurs verwendeten Quellen und der Tools zur Auswertung, die Ihnen helfen können.
Quellen
Für diese Serie haben wir uns auf verschiedene Quellen gestützt, darunter:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen
- Risikominimierung bei der Qualitätssicherung für LLM-basierte Anwendungen – Michael Hablich, Chrome-Entwicklertools
- Using LLM-as-a-Judge For Evaluation: A Complete Guide - Hamel Husain
Tools zur Bewertung
Beispiele für Lösungen und Tools für die Evaluierung:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- Gen AI Evaluation Service und API von Vertex AI
- Evals prüfen
- JudgeLM
- LangSmith
- Evaluierungstool
- OpenEvals
Diese Liste ist nicht vollständig. Wenn Sie andere Bewertungstools verwenden, teilen Sie sie uns mit.