רשימה חלקית של מקורות שנעשה בהם שימוש בקורס הזה ובכלי ההערכה שיכולים לעזור לכם.
מקורות
הסתמכנו על כמה מקורות כדי לכתוב את הסדרה הזו, כולל:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen
- הפחתת הסיכון בבדיקת איכות של אפליקציות מבוססות-LLM – מייקל הבלייך, כלי הפיתוח ל-Chrome
- Using LLM-as-a-Judge For Evaluation: A Complete Guide - Hamel Husain
כלי הערכה
דוגמאות לפתרונות ולכלים להערכות:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- שירות הערכה של AI גנרטיבי וAPI מבית Vertex AI
- בדיקת הערכות
- JudgeLM
- LangSmith
- Evaluation harness
- OpenEvals
זוהי רשימה חלקית בלבד. אם אתם משתמשים בכלי הערכה אחרים, אתם מוזמנים לשתף אותם איתנו.