Inizia a utilizzare l'IA integrata

Alexandra Klepper
Alexandra Klepper

Pubblicato il 12 dicembre 2024, ultimo aggiornamento il 20 maggio 2025

Grazie alle API AI integrate, la tua applicazione web può eseguire attività basate sull'AI senza dover eseguire il deployment o gestire i propri modelli di AI. Stiamo lavorando per standardizzare queste API su tutti i browser.

Requisiti

Per utilizzare l'AI integrata, sono necessari requisiti di modello e hardware.

Modelli

Le API Translator e Language Detector utilizzano modelli esperti. Tutte le altre API utilizzano un modello linguistico, progettato per essere eseguito localmente su computer desktop e laptop.

Le API Summarizer, Writer, Rewriter e Proofreader supportano solo la modalità da testo a testo. L' API Prompt ha funzionalità multimodali.

I modelli in Chrome

Chrome utilizza modelli linguistici esperti e di base. Questi modelli non sono disponibili sui dispositivi mobili.

A partire da Chrome 149, i modelli supportano inglese, spagnolo, giapponese, tedesco e francese per il testo di input e output.

Hardware

Esistono i seguenti requisiti per gli sviluppatori e gli utenti che utilizzano le funzionalità che utilizzano queste API in Chrome. Altri browser potrebbero avere requisiti operativi diversi.

Le API Language Detector e Translator funzionano in Chrome su computer desktop. Queste API non funzionano sui dispositivi mobili.

Le API Prompt, Summarizer, Writer, Rewriter e Proofreader funzionano in Chrome quando vengono soddisfatte le seguenti condizioni:

  • Sistema operativo: Windows 10 o 11; macOS 13+ (Ventura e versioni successive); Linux; o ChromeOS (a partire dalla piattaforma 16389.0.0 e versioni successive) sui Chromebook Plus dispositivi. Chrome per Android, iOS e ChromeOS sui dispositivi non Chromebook Plus non è ancora supportato dalle API che utilizzano modelli di base.
  • Spazio di archiviazione: almeno 22 GB di spazio libero sul volume che contiene il profilo Chrome.
  • GPU o CPU: i modelli integrati possono essere eseguiti con GPU o CPU.
    • GPU: rigorosamente più di 4 GB di VRAM.
    • CPU: almeno 16 GB di RAM e almeno 4 core CPU.
    • Nota: l'API Prompt con input audio richiede una GPU.
  • Rete: dati illimitati o una connessione non a consumo.

Le dimensioni esatte di Gemini Nano possono variare man mano che il browser aggiorna il modello. Per determinare le dimensioni attuali, visita chrome://on-device-internals.

Inizia a creare

Sono disponibili diverse API AI integrate in varie fasi di sviluppo. Alcune sono in Chrome stabile, altre sono disponibili per i partecipanti alle prove dell'origine e altre ancora sono disponibili solo per i partecipanti al programma di anteprima.

Ogni API ha il proprio insieme di istruzioni per iniziare e scaricare il modello, sia per la prototipazione locale sia negli ambienti di produzione con le prove dell'origine.

Tutte queste API possono essere utilizzate durante la creazione di estensioni di Chrome.

Download modello

Le API sono integrate in Chrome, così come i modelli. La prima volta che un utente interagisce con queste API, il modello deve essere scaricato nel browser.

Per determinare se un'API è utilizzabile e pronta, chiama la funzione asincrona availability(), che restituisce una promessa con uno dei seguenti valori:

  • "unavailable": il dispositivo dell'utente o le opzioni di sessione richieste non sono supportate. Il dispositivo potrebbe avere alimentazione o spazio su disco insufficienti.
  • "downloadable": sono necessari download aggiuntivi per creare una sessione, che può includere un modello esperto, un modello linguistico o un'ottimizzazione. L'attivazione dell'utente potrebbe essere necessaria per chiamare create().
  • "downloading": i download sono in corso e devono essere completati prima di poter utilizzare una sessione.
  • "available": puoi creare una sessione immediatamente.

Alcune API richiedono opzioni aggiuntive quando si chiama la disponibilità. Ad esempio, l'API Prompt richiede la dichiarazione del supporto linguistico:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Attivazione utente

Se il dispositivo è in grado di supportare le API AI integrate, ma il modello non è ancora stato scaricato, l'utente deve interagire in modo significativo con la pagina affinché l'applicazione possa avviare una sessione con create().

Utilizza la UserActivation.isActive proprietà per verificare che un utente abbia interagito direttamente con la pagina dopo il completamento del caricamento. Può trattarsi di un tocco, un clic, una pressione di un tasto, mousedown, o altri eventi di attivazione persistenti.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Ad esempio, con l'API Summarizer, puoi chiedere agli utenti di interagire con un pulsante con la dicitura "Riassumi" per attivare Summarizer.create(), oppure puoi creare il riassunto una volta che l'utente ha iniziato a digitare, un evento keydown.

Utilizzare le API su localhost

Tutte le API sono disponibili su localhost in Chrome.

  1. Vai a chrome://flags/#optimization-guide-on-device-model.
  2. Seleziona Attivato.
  3. Fai clic su Riavvia o riavvia Chrome.

Per le API che utilizzano Gemini Nano, devi anche impostare chrome://flags/#prompt-api-for-gemini-nano su Attivato o Attivato multilingue. Puoi verificare che il modello sia stato scaricato e funzioni come previsto nella console DevTools. Esegui await LanguageModel.availability(); nella console.

Risolvere i problemi di localhost

Se i flag non vengono visualizzati in chrome://flags, assicurati di aver scaricato la versione più recente di Chrome.

Se il modello non funziona come previsto, segui questi passaggi:

  1. Riavvia Chrome.
  2. Vai a chrome://on-device-internals.
  3. Seleziona la scheda Stato modello e assicurati che non siano presenti errori.
  4. Apri DevTools e digita LanguageModel.availability(); nella console. Dovrebbe essere restituito available.

Se necessario, attendi un po' di tempo e ripeti questi passaggi.

Processo di standardizzazione

Stiamo lavorando per standardizzare queste API, in modo che funzionino su tutti i browser. Ciò significa che abbiamo proposto le API a la community delle piattaforme web e le abbiamo spostate nel gruppo della community W3C Web Incubator per ulteriori discussioni.

Stiamo richiedendo feedback a W3C, Mozilla e WebKit per ogni API.

Interagisci e condividi feedback

Se provi l'AI integrata e hai feedback, non esitare a comunicarcelo.