AI 평가에 관한 과정 수강하기
컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
Maud Nalpas
Alexandra Klepper
게시일: 2026년 4월 14일
생성형 AI 이전에는 AI 테스트가 다른 형태의 소프트웨어 테스트와 유사했습니다.
동일한 코드, 데이터, 설정을 사용하면 동일한 결과를 얻을 수 있습니다.
테스트는 재현 가능하고
알고리즘은 결정적입니다.
소프트웨어는 예측 가능하며 이는 사용자의 신뢰를 형성합니다.
생성형 AI를 사용하면 품질이 객관적이기보다는 주관적이 됩니다. 테스트는 매우 중요합니다. 테스트를 통해 팀은 자신 있게 사용자에게 기능을 제공할 수 있습니다. AI 평가 (또는 약칭 evals)를 사용하면 새로운 워크플로를 사용하여 애플리케이션을 테스트할 수 있습니다.
앞으로 몇 주에 걸쳐 AI 평가에 관한 강의가 출시될 예정입니다. 첫 번째 AI 테스트 파이프라인을 설정하는 데 필요한 모든 기본사항부터 시작합니다. 그런 다음 더 고급 기법을 공유하여 평가를 계속 반복하고 개선할 수 있도록 합니다.
이러한 기법은 빠르게 변화하는 AI 환경에서 새로운 기법입니다.
정확한 도구는 변경될 수 있지만 이러한 권장사항은 오래 지속되도록 설계되었습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2026-04-14(UTC)"],[],[]]