公開: 2026 年 4 月 14 日
生成 AI が登場する前は、AI のテストは他の形式のソフトウェア テストと似ていました。 同じコード、データ、設定を使用すると、同じ結果が得られるはずです。 テストは再現可能で、 アルゴリズムは決定的です。 ソフトウェアは予測可能であり、ユーザーの信頼を築くことができます。
生成 AI では、品質は客観的なものではなく主観的なものになります。テストは非常に重要です。テストを行うことで、チームは自信を持ってユーザーに機能をリリースできます。AI 評価(または evals)では、新しいワークフローを使用してアプリケーションをテストします。
今後数週間のうちに、AI 評価に関するレッスンをリリースします。まずは、最初の AI テスト パイプラインを設定するために必要なすべての基本事項から始めます。その後、より高度な手法を紹介します。これにより、評価を反復して改善できます。
これらは、急速に変化する AI の状況における新しい手法です。 正確なツールは変化する可能性がありますが、これらのベスト プラクティスは長く使えるように構築されています。
最初の 4 つのモジュールは、2026 年 4 月 16 日に公開されます。
意見交換とフィードバックの提供
このコースにご期待ください。ご質問や取り上げてほしいトピックがありましたら、 ぜひお聞かせください。 ミーティングをスケジュールするか、 ソーシャル メディアでメッセージをお送りください: BlueSky、 LinkedIn、 または X。
早期プレビュー プログラムに参加 して、新しい AI API をいち早く確認し、メーリング リストにアクセスしてください。