Danh sách chưa đầy đủ về các nguồn được dùng trong khoá học này và các công cụ đánh giá có thể giúp bạn.
Nguồn
Chúng tôi đã dựa vào một số nguồn để viết loạt bài này, bao gồm:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen
- De-risking QA for LLM-powered applications – Michael Hablich, Chrome DevTools
- Using LLM-as-a-Judge For Evaluation: A Complete Guide – Hamel Husain
Công cụ đánh giá
Sau đây là một số ví dụ về các giải pháp và công cụ đánh giá:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- Dịch vụ đánh giá AI tạo sinh và API của Vertex AI
- Kiểm tra các công cụ đánh giá
- JudgeLM
- LangSmith
- Evaluation harness
- OpenEvals
Danh sách này chưa phải là danh sách đầy đủ. Nếu bạn đang sử dụng các công cụ đánh giá khác, hãy chia sẻ với chúng tôi.