รายการแหล่งข้อมูลโดยสังเขปที่ใช้ในหลักสูตรนี้และเครื่องมือประเมินที่ช่วยคุณได้
แหล่งที่มา
เราอ้างอิงจากแหล่งข้อมูลหลายแห่งในการเขียนชุดข้อมูลนี้ ซึ่งรวมถึง
- วิศวกรรม AI: การสร้างแอปพลิเคชันด้วยโมเดลพื้นฐาน Chip Huyen
- ลดความเสี่ยงในการ QA สำหรับแอปพลิเคชันที่ทำงานด้วย LLM - Michael Hablich, เครื่องมือสำหรับนักพัฒนาเว็บใน Chrome
- Using LLM-as-a-Judge For Evaluation: A Complete Guide - Hamel Husain
เครื่องมือประเมิน
ตัวอย่างโซลูชันและเครื่องมือการประเมิน ได้แก่
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- บริการประเมิน Gen AI และ API โดย Vertex AI
- ตรวจสอบการประเมิน
- JudgeLM
- LangSmith
- ชุดเครื่องมือประเมิน
- OpenEvals
รายการนี้เป็นเพียงตัวอย่างบางส่วนเท่านั้น หากคุณใช้เครื่องมือประเมินอื่นๆ โปรดแชร์ให้เราทราบ