Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Quellen und Tools

Unvollständige Liste der in diesem Kurs verwendeten Quellen und der Tools, die Ihnen helfen können.

Maud Nalpas

Weitere Ressourcen zum Testen und zu KI finden Sie hier.

Learn Testing: Refresh your approach to testing
Learn AI: Design AI systems for your websites and web applications
Google DeepMind Evals: Multiple standardized benchmarking tools for different types on models
Gemini Evaluations Playbook: Recipes for experimenting and evaluating generative AI models with Vertex AI.
Responsible AI toolkit: Evaluate models and systems for safety.
Evaluating your evals: A meta lesson on how to understand what evals to use, and what works effectively.
Building better AI benchmarks: How many raters are enough? Understand an evaluation framework for ML models that optimizes the trade-off between the number of items and raters per item, to build reproducible AI benchmarks.

Kursquellen

Für diese Reihe haben wir uns auf mehrere Quellen gestützt, darunter:

Beispiele für Evaluierungslösungen und ‑tools:

Es gibt noch viele weitere Evaluierungstools. Wenn Sie andere Tools verwenden, teilen Sie uns das bitte mit.