Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

組み込みの AI を使ってみる

Alexandra Klepper

公開日: 2024 年 12 月 12 日、最終更新日: 2025 年 5 月 20 日

組み込みの AI API を使用すると、ウェブアプリケーションは独自の AI モデルをデプロイまたは管理することなく、AI を活用したタスクを実行できます。 Google では、これらの API をブラウザ間で標準化する取り組みを進めています。

要件

組み込みの AI を使用するには、モデルとハードウェアの要件があります。

モデル

Translator API と Language Detector API はエキスパートモデルを使用します。他のすべての API は、デスクトップとノートパソコンでローカルに実行するように設計された言語モデルを使用します。

Summarizer API、Writer API、Rewriter API、Proofreader API は、テキストからテキストへのモダリティのみをサポートしています。Prompt API にはマルチモーダル機能があります。

Chrome の Gemini Nano

Chrome は Gemini Nano 言語モデルを使用します。Gemini Nano はモバイルデバイスでは使用できません。

Chrome 149 以降では、Gemini Nano は入力テキストと出力テキストで英語、スペイン語、日本語、ドイツ語、フランス語をサポートしています。

組み込みの AI API を使用する前に、 Google の生成 AI の使用禁止に関するポリシーに同意してください。

ハードウェア

Chrome でこれらの API を使用して機能を操作するデベロッパーとユーザーには、次の要件があります。他のブラウザでは、動作要件が異なる場合があります。

Language Detector と Translator API は、デスクトップ版 Chrome で動作します。これらの API はモバイルデバイスでは動作しません。

Prompt API、Summarizer API、Writer API、Rewriter API、Proofreader API は、次の条件を満たす場合に Chrome で動作します。

オペレーティングシステム: Windows 10 または 11、macOS 13 以降（Ventura 以降）、 Linux、またはChromebook Plus デバイスの ChromeOS（プラットフォーム 16389.0.0 以降）。 Gemini Nano を使用する API は、Chromebook Plus 以外のデバイスの Chrome for Android、iOS、ChromeOS ではまだサポートされていません。
ストレージ: Chrome プロファイルを含むボリュームに 22 GB 以上の空き容量。
組み込みモデルは大幅に小さくなります。正確なサイズは、更新によって若干異なる場合があります。
GPU または CPU: 組み込みモデルは GPU または CPU で実行できます。
- GPU: 4 GB を超える VRAM。
- CPU: 16 GB 以上の RAM と 4 個以上の CPU コア。
- 注: 音声入力を使用する Prompt API には GPU が必要です。
ネットワーク: 無制限のデータまたは従量制課金ではない接続。
重要な用語: 従量制課金接続とは、データに制限のあるインターネット接続のことです。Wi-Fi 接続とイーサネット接続はデフォルトで定額制である傾向がありますが、モバイル接続は従量制であることがよくあります。

注: ネットワーク要件は、モデルの初回ダウンロードのみに適用されます。モデルをその後使用する際に、ネットワーク接続は必要ありません。モデルを使用しても、 Google やサードパーティにデータが送信されることはありません。

Gemini Nano の正確なサイズは、ブラウザがモデルを更新するたびに異なる場合があります。現在のサイズを確認するには、chrome://on-device-internals にアクセスしてください。

構築を開始

開発のさまざまな段階で、いくつかの組み込み AI API を使用できます。Chrome の安定版で提供されているものもあれば、オリジントライアルの参加者が利用できるもの、早期プレビュープログラムの参加者のみが利用できるものもあります。

各 API には、ローカルプロトタイピングとオリジントライアルを使用した本番環境の両方で、モデルをダウンロードして使用を開始するための独自の手順が用意されています。

これらの API はすべて、Chrome 拡張機能の構築時に使用できます。

モデルのダウンロード

API はモデルと同様に Chrome に組み込まれています。ユーザーがこれらの API を初めて操作するときに、モデルをブラウザにダウンロードする必要があります。

API が使用可能で準備ができているかどうかを確認するには、非同期の availability() 関数を呼び出します。この関数は、次のいずれかの値を含む Promise を返します。

"unavailable": ユーザーのデバイスまたはリクエストされたセッションオプションはサポートされていません。デバイスの電源またはディスク容量が不足している可能性があります。
"downloadable": セッションを作成するには、追加のダウンロードが必要です。これには、エキスパートモデル、言語モデル、ファインチューニングが含まれる場合があります。ユーザーのアクティブ化は、create()を呼び出すために必要になる場合があります。
"downloading": ダウンロードが進行中です。セッションを使用するには、ダウンロードが完了する必要があります。
"available": セッションをすぐに作成できます。

一部の API では、可用性を呼び出す際に追加のオプションが必要です。たとえば、 Prompt API では言語サポートを宣言する必要があります。

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

ユーザーのアクティブ化

デバイスが組み込みの AI API をサポートしているが、モデルがまだダウンロードされていない場合、アプリケーションが create() でセッションを開始するには、ユーザーがページを操作する必要があります。

UserActivation.isActive プロパティを使用して、ページが読み込まれてからユーザーがページを直接操作したことを確認します。これには、タップ、クリック、キー押下、mousedown、またはその他の固定アクティベーションイベントが含まれます。

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

たとえば、Summarizer API では、ユーザーに [要約] ボタンを操作してを有効にするように依頼できます。また、ユーザーが入力（keydown イベント）を開始したら、サマライザーを作成することもできます。Summarizer.create()

localhost で API を使用する

すべての API は、Chrome の localhost で使用できます。

chrome://flags/#optimization-guide-on-device-model に移動します。
[有効] を選択します。
[再起動] をクリックするか、Chrome を再起動します。

Gemini Nano を使用する API の場合は、chrome://flags/#prompt-api-for-gemini-nano を [有効] または [多言語対応を有効にする] に設定する必要があります。モデルがダウンロードされ、意図したとおりに動作していることをデベロッパーツールのコンソールで確認できます。コンソールで await LanguageModel.availability(); を実行します。

localhost のトラブルシューティング

chrome://flags にフラグが表示されない場合は、最新バージョンの Chrome をダウンロードしていることを確認してください。

モデルが想定どおりに動作しない場合は、次の手順を行います。

Chrome を再起動します。
chrome://on-device-internals に移動します。
[モデルのステータス] タブを選択し、エラーがないことを確認します。
デベロッパーツールを開き、コンソールに「LanguageModel.availability();」と入力します。available が返されます。

必要に応じて、しばらく待ってからこれらの手順を繰り返します。

標準プロセス

Google では、すべてのブラウザで動作するように、これらの API の標準化に取り組んでいます。つまり、ウェブプラットフォームコミュニティに API を提案し、 W3C Web Incubator Community Group に移行してさらに議論を進めています。

Google は、各 API について W3C、Mozilla、WebKit にフィードバックを求めています。

意見交換とフィードバックの提供

組み込みの AI を試してフィードバックがございましたら、ぜひお聞かせください。

組み込みの AI API をすべて確認する。
早期プレビュープログラムに参加して、新しい API をいち早く確認し、メーリングリストにアクセスする。
Chrome の実装についてフィードバックがある場合は、 Chromium のバグを報告する。
ウェブ標準について学ぶ。