Неполный список источников, использованных в этом курсе, и инструментов оценки, которые могут вам помочь.
Источники
При написании этой серии статей мы опирались на несколько источников, в том числе:
- Разработка приложений с использованием искусственного интеллекта: создание приложений на основе базовых моделей, Чип Хуен
- Снижение рисков в тестировании приложений на основе LLM — Майкл Хаблих, Chrome DevTools
- Использование дипломированных юристов в качестве экспертов для оценки: полное руководство - Хамель Хусейн
Инструменты оценки
Примеры решений и инструментов для оценки включают:
- AlignEval
- Аризе
- Мозговой центр
- Датадог
- DeepEval
- Сервис оценки Gen AI и API от Vertex AI
- Проверка оценок
- JudgeLM
- ЛангСмит
- Оценочный комплект
- OpenEvals
Этот список не является исчерпывающим. Если вы используете другие инструменты оценки, поделитесь ими с нами .