Lista não exaustiva de fontes usadas neste curso e ferramentas de avaliação que podem ajudar você.
Fontes
Usamos várias fontes para escrever esta série, incluindo:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen (em inglês)
- De-risking QA for LLM-powered applications - Michael Hablich, Chrome DevTools (em inglês)
- Using LLM-as-a-Judge For Evaluation: A Complete Guide - Hamel Husain (em inglês)
Ferramentas de avaliação
Exemplos de soluções e ferramentas de avaliação incluem:
- AlignEval
- Arize (em inglês)
- Braintrust (em inglês)
- Datadog (em inglês)
- DeepEval
- Serviço de avaliação de IA generativa e API da Vertex AI
- Inspect Evals (em inglês)
- JudgeLM
- LangSmith
- Evaluation harness (em inglês)
- OpenEvals
Esta não é uma lista completa. Se você estiver usando outras ferramentas de avaliação, compartilhe-as conosco.