قائمة غير شاملة بالمصادر المستخدَمة في هذه الدورة التدريبية وأدوات التقييم التي يمكن أن تساعدك
للاطّلاع على المزيد من المراجع حول الاختبارات والذكاء الاصطناعي، ننصحك بالاطّلاع على المراجع التالية.
- Learn Testing: يمكنك تحسين أسلوبك في إجراء الاختبارات.
- تعلُّم الذكاء الاصطناعي: تصميم أنظمة الذكاء الاصطناعي لمواقعك الإلكترونية وتطبيقات الويب
- أدوات التقييم من Google DeepMind: أدوات متعددة موحّدة لقياس الأداء لأنواع مختلفة من النماذج
- دليل تقييم Gemini: وصفات لتجربة نماذج الذكاء الاصطناعي التوليدي وتقييمها باستخدام Vertex AI
- مجموعة أدوات الذكاء الاصطناعي المسؤول: تقييم النماذج والأنظمة من حيث الأمان
- تقييم عمليات التقييم: درس شامل حول كيفية فهم عمليات التقييم التي يجب استخدامها، وما هو فعال منها.
- وضع معايير أفضل للذكاء الاصطناعي: ما هو العدد الكافي من المقيمين؟ فهم إطار عمل تقييم لنماذج تعلُّم الآلة يحسّن المفاضلة بين عدد العناصر والمُصنِّفين لكل عنصر، وذلك لإنشاء مقاييس أداء قابلة للتكرار للذكاء الاصطناعي.
مصادر الدورات التدريبية
استندنا إلى عدة مصادر لكتابة هذه السلسلة، بما في ذلك:
- AI Engineering: Building Applications with Foundation Models، Chip Huyen
- تقليل مخاطر ضمان الجودة للتطبيقات المستندة إلى نماذج اللغات الكبيرة، بقلم "مايكل هابليش"، فريق "أدوات مطوّري البرامج في Chrome"
- استخدام نماذج اللغات الكبيرة كأداة تقييم: دليل كامل من تأليف "هامل حسين"
أدوات التقييم
تشمل أمثلة حلول وأدوات التقييم ما يلي:
- AlignEval
- Arize
- Braintrust
- Datadog
- DeepEval
- خدمة تقييم الذكاء الاصطناعي التوليدي و واجهة برمجة التطبيقات
- فحص التقييمات
- JudgeLM
- LangSmith
- أداة التقييم
- OpenEvals
تتوفّر العديد من أدوات التقييم الأخرى. إذا كنت تستخدم أدوات أخرى، شارِكها معنا.