فهرست ناقص منابع مورد استفاده در این دوره و ابزارهای ارزیابی که میتوانند به شما کمک کنند.
برای منابع بیشتر در مورد تست و هوش مصنوعی، منابع زیر را توصیه میکنیم.
- یادگیری تست : رویکرد خود را به تست بهروزرسانی کنید.
- یادگیری هوش مصنوعی : طراحی سیستمهای هوش مصنوعی برای وبسایتها و برنامههای وب شما
- ارزیابیهای گوگل دیپمایند : ابزارهای معیارسنجی استاندارد چندگانه برای انواع مختلف مدلها
- کتاب ارزیابیهای جمینی : دستورالعملهایی برای آزمایش و ارزیابی مدلهای هوش مصنوعی مولد با هوش مصنوعی ورتکس
- جعبه ابزار هوش مصنوعی مسئولانه : ارزیابی مدلها و سیستمها از نظر ایمنی.
- ارزیابی ارزیابیهای شما : یک درس متا در مورد چگونگی درک اینکه از چه ارزیابیهایی استفاده کنیم و کدام یک به طور موثر کار میکند.
- ساخت معیارهای هوش مصنوعی بهتر: چند ارزیاب کافی است؟ یک چارچوب ارزیابی برای مدلهای یادگیری ماشینی را درک کنید که بده بستان بین تعداد آیتمها و ارزیابها به ازای هر آیتم را بهینه میکند تا معیارهای هوش مصنوعی قابل تکرار ایجاد کند.
منابع دوره
ما برای نوشتن این مجموعه به منابع مختلفی تکیه کردیم، از جمله:
- مهندسی هوش مصنوعی: ساخت برنامههای کاربردی با مدلهای بنیادی، چیپ هوین
- تضمین کیفیت ریسکزدایی برای برنامههای مبتنی بر LLM توسط مایکل هابلیچ، Chrome DevTools
- استفاده از مدرک کارشناسی ارشد حقوق به عنوان قاضی برای ارزیابی: راهنمای کامل ، نوشتهی هامل حسین
ابزارهای ارزیابی
نمونههایی از راهحلها و ابزارهای ارزیابی عبارتند از:
- ترازبندی ایول
- آریزه
- برینتراست
- دیتاداگ
- دیپ ایول
- سرویس ارزیابی هوش مصنوعی عمومی و API
- بررسی مقادیر
- قاضی ال ام
- لانگ اسمیت
- مهار ارزیابی
- اوپناِوالز
ابزارهای ارزیابی بسیار بیشتری در دسترس هستند. اگر از ابزارهای دیگری استفاده میکنید، آنها را با ما به اشتراک بگذارید .