قائمة غير شاملة بالمصادر المستخدَمة في هذه الدورة التدريبية وأدوات التقييم التي يمكن أن تساعدك
المصادر
اعتمدنا على عدة مصادر لكتابة هذه السلسلة، بما في ذلك:
- AI Engineering: Building Applications with Foundation Models, Chip Huyen
- De-risking QA for LLM-powered applications - Michael Hablich, Chrome DevTools
- Using LLM-as-a-Judge For Evaluation: A Complete Guide - Hamel Husain
أدوات التقييم
في ما يلي أمثلة على حلول وأدوات التقييم:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- Gen AI evaluation service and API by Vertex AI
- Inspect Evals
- JudgeLM
- LangSmith
- Evaluation harness
- OpenEvals
يُرجى العِلم بأن هذه القائمة ليست شاملة. إذا كنت تستخدم أدوات تقييم أخرى، يُرجى مشاركتها معنا.