Daftar tidak lengkap sumber yang digunakan dalam kursus ini dan alat evaluasi yang dapat membantu Anda.
Sumber
Kami mengandalkan beberapa sumber untuk menulis seri ini, termasuk:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen
- Mengurangi risiko QA untuk aplikasi yang didukung LLM - Michael Hablich, Chrome DevTools
- Menggunakan LLM sebagai Penilai untuk Evaluasi: Panduan Lengkap - Hamel Husain
Alat evaluasi
Contoh solusi dan alat evaluasi meliputi:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- Layanan evaluasi AI generatif dan API oleh Vertex AI
- Periksa Evaluasi
- JudgeLM
- LangSmith
- Platform evaluasi
- OpenEvals
Ini bukanlah daftar lengkap. Jika Anda menggunakan alat evaluasi lainnya, bagikan kepada kami.