Lista no exhaustiva de fuentes que se usaron en este curso y herramientas de evaluación que pueden ayudarte.
Fuentes
Nos basamos en varias fuentes para escribir esta serie, incluidas las siguientes:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen
- De-risking QA for LLM-powered applications - Michael Hablich, Chrome DevTools
- Using LLM-as-a-Judge For Evaluation: A Complete Guide - Hamel Husain
Herramientas de evaluación
Los siguientes son algunos ejemplos de soluciones y herramientas de evaluación:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- Gen AI evaluation service and API by Vertex AI
- Inspect Evals
- JudgeLM
- LangSmith
- Evaluation harness
- OpenEvals
Esta lista no es exhaustiva. Si usas otras herramientas de evaluación, compártelas con nosotros.