이 과정에서 사용된 소스 및 도움이 될 수 있는 평가 도구의 일부 목록입니다.
소스
이 시리즈를 작성하기 위해 다음과 같은 여러 소스를 사용했습니다.
- AI 엔지니어링: 파운데이션 모델로 애플리케이션 빌드(Chip Huyen)
- LLM 기반 애플리케이션의 QA 위험 완화(Michael Hablich, Chrome DevTools)
- 평가를 위한 LLM을 심판으로 사용: 전체 가이드(Hamel Husain)
평가 도구
평가 솔루션 및 도구의 예는 다음과 같습니다.
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- Vertex AI의 Gen AI Evaluation Service 및 API
- 평가 검사
- JudgeLM
- LangSmith
- 평가 하네스
- OpenEvals
이 목록은 일부일 뿐 모든 내용을 포함하지는 않습니다. 다른 평가 도구를 사용하는 경우 Google에 공유해 주세요.