Erste Schritte mit integrierter KI

Alexandra Klepper
Alexandra Klepper

Veröffentlicht am 12. Dezember 2024, zuletzt aktualisiert am 20. Mai 2025

Mit integrierten KI-APIs kann Ihre Webanwendung KI-gestützte Aufgaben ausführen, ohne eigene KI-Modelle bereitstellen oder verwalten zu müssen. Wir arbeiten daran, diese APIs browserübergreifend zu standardisieren.

Voraussetzungen

Für die Verwendung von integrierter KI gelten bestimmte Modell- und Hardwareanforderungen.

Modelle

Die Translator API und die Language Detector API verwenden Expertenmodelle. Alle anderen APIs verwenden ein Language Model, das für die lokale Ausführung auf Desktops und Laptops entwickelt wurde.

Die Summarizer API, Writer API, Rewriter API und Proofreader API unterstützen nur die Text-zu-Text-Modalität. Die Prompt API bietet multimodale Funktionen.

Gemini Nano in Chrome

Chrome verwendet die Sprachmodelle von Gemini Nano. Gemini Nano ist auf Mobilgeräten nicht verfügbar.

Ab Chrome 149 unterstützt Gemini Nano Englisch, Spanisch, Japanisch, Deutsch und Französisch für Eingabe- und Ausgabetext.

Bevor Sie die integrierten KI-APIs verwenden, müssen Sie die Richtlinie zur unzulässigen Nutzung von generativer KI von Google akzeptieren.

Hardware

Die folgenden Anforderungen gelten für Entwickler und Nutzer, die Funktionen mit diesen APIs in Chrome verwenden. Bei anderen Browsern gelten möglicherweise andere Betriebsanforderungen.

Die Language Detector API und die Translator API funktionieren in Chrome auf dem Desktop. Diese APIs funktionieren nicht auf Mobilgeräten.

Die Prompt API, Summarizer API, Writer API, Rewriter API und Proofreader API funktionieren in Chrome, wenn die folgenden Bedingungen erfüllt sind:

  • Betriebssystem: Windows 10 oder 11, macOS 13 oder höher (Ventura und höher), Linux oder ChromeOS (ab Plattform 16389.0.0) auf Chromebook Plus-Geräten. Chrome für Android, iOS und ChromeOS auf Geräten, die keine Chromebook Plus-Geräte sind, wird von den APIs, die Gemini Nano verwenden, noch nicht unterstützt von den APIs, die Gemini Nano verwenden.
  • Speicher: Mindestens 22 GB freier Speicherplatz auf dem Volume, das Ihr Chrome-Profil enthält.
  • GPU oder CPU: Integrierte Modelle können mit GPU oder CPU ausgeführt werden.
    • GPU: Mehr als 4 GB VRAM.
    • CPU: Mindestens 16 GB RAM und mindestens 4 CPU-Kerne.
    • Hinweis: Für die Prompt API mit Audioeingabe ist eine GPU erforderlich.
  • Netzwerk: Unbegrenzte Daten oder eine nicht getaktete Verbindung.

Die genaue Größe von Gemini Nano kann variieren, da das Modell vom Browser aktualisiert wird. Die aktuelle Größe finden Sie unter chrome://on-device-internals.

Gleich mit dem Erstellen loslegen

Es gibt mehrere integrierte KI-APIs, die sich in verschiedenen Entwicklungsstadien befinden. Einige sind in der stabilen Chrome-Version verfügbar, andere sind für Teilnehmer von Ursprungstests verfügbar und wieder andere sind nur für Teilnehmer des Early Preview Program verfügbar.

Für jede API gibt es eine eigene Anleitung für den Einstieg und zum Herunterladen des Modells, sowohl für das lokale Prototyping als auch in Produktionsumgebungen mit den Origin-Tests.

Alle diese APIs können beim Erstellen von Chrome-Erweiterungen verwendet werden.

Download des Modells

APIs sind in Chrome integriert, ebenso die Modelle. Wenn ein Nutzer zum ersten Mal mit diesen APIs interagiert, muss das Modell in den Browser heruntergeladen werden.

Um festzustellen, ob eine API verwendet werden kann und bereit ist, rufen Sie die asynchrone Funktion availability() auf. Diese gibt ein Promise mit einem der folgenden Werte zurück:

  • "unavailable": Das Gerät des Nutzers oder die angeforderten Sitzungsoptionen werden nicht unterstützt. Das Gerät hat möglicherweise nicht genügend Strom oder Speicherplatz.
  • "downloadable": Zum Erstellen einer Sitzung sind zusätzliche Downloads erforderlich, die z. B. ein Expertenmodell, ein Sprachmodell oder eine Feinabstimmung umfassen können. Nutzeraktivierung ist möglicherweise erforderlich, um create() aufzurufen.
  • "downloading": Downloads sind noch nicht abgeschlossen. Sie müssen abgeschlossen sein, bevor Sie eine Sitzung verwenden können.
  • "available": Sie können sofort eine Sitzung erstellen.

Für einige APIs sind zusätzliche Optionen erforderlich, wenn die Verfügbarkeit aufgerufen wird. Für die Prompt API muss beispielsweise die Sprachunterstützung deklariert werden:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Nutzeraktivierung

Wenn das Gerät integrierte KI-APIs unterstützt, das Modell aber noch nicht heruntergeladen wurde, muss der Nutzer auf sinnvolle Weise mit Ihrer Seite interagieren, damit Ihre Anwendung eine Sitzung mit create() starten kann.

Verwenden Sie die UserActivation.isActive Eigenschaft, um zu bestätigen, dass ein Nutzer seit dem Laden der Seite direkt mit der Seite interagiert hat. Dazu gehören beispielsweise Tippen, Klicken, Tastendrücke, mousedown, oder andere dauerhafte Aktivierungsereignisse.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Mit der Summarizer API können Sie Nutzer beispielsweise auffordern, auf eine Schaltfläche mit der Aufschrift „Zusammenfassen“ zu klicken, um zu aktivieren. Alternativ können Sie die Zusammenfassung erstellen, sobald ein Nutzer mit der Eingabe begonnen hat, also bei einem keydown Ereignis.Summarizer.create()

APIs auf „localhost“ verwenden

Alle APIs sind in Chrome auf localhost verfügbar.

  1. Rufen Sie chrome://flags/#optimization-guide-on-device-model auf.
  2. Wählen Sie Aktiviert aus.
  3. Klicken Sie auf Neu starten oder starten Sie Chrome neu.

Für APIs, die Gemini Nano verwenden, müssen Sie außerdem chrome://flags/#prompt-api-for-gemini-nano auf Aktiviert oder Aktiviert (mehrsprachig) festlegen. In der DevTools Console können Sie prüfen, ob das Modell heruntergeladen wurde und wie vorgesehen funktioniert. Führen Sie in der Console await LanguageModel.availability(); aus.

Fehlerbehebung bei „localhost“

Wenn die Flags nicht unter chrome://flags angezeigt werden, prüfen Sie, ob Sie die neueste Version von Chrome heruntergeladen haben.

Wenn das Modell nicht wie erwartet funktioniert, führen Sie die folgenden Schritte aus:

  1. Starten Sie Chrome neu.
  2. Rufen Sie chrome://on-device-internals auf.
  3. Wählen Sie den Tab Modellstatus aus und prüfen Sie, ob Fehler vorliegen.
  4. Öffnen Sie die DevTools und geben Sie LanguageModel.availability(); in die Console ein. Das Ergebnis sollte available sein.

Warten Sie gegebenenfalls einige Zeit und wiederholen Sie diese Schritte.

Standardprozess

Wir arbeiten daran, diese APIs zu standardisieren, damit sie in allen Browsern funktionieren. Das bedeutet, dass wir die APIs der Webplattform-Community vorgeschlagen und sie zur weiteren Diskussion in die W3C Web Incubator Community Group verschoben haben.

Wir bitten das W3C, Mozilla und WebKit um Feedback zu jeder API.

Mitmachen und Feedback geben

Wenn Sie integrierte KI ausprobieren und Feedback haben, freuen wir uns darauf.