Pubblicato il 12 dicembre 2024, ultimo aggiornamento il 20 maggio 2025
Grazie alle API AI integrate, la tua applicazione web può eseguire attività basate sull'AI senza dover eseguire il deployment o gestire i propri modelli di AI. Stiamo lavorando per standardizzare queste API su tutti i browser.
Requisiti
Per utilizzare l'AI integrata, sono necessari requisiti di modello e hardware.
Modelli
Le API Translator e Language Detector utilizzano modelli esperti. Tutte le altre API utilizzano un modello linguistico, progettato per essere eseguito localmente su computer desktop e laptop.
Le API Summarizer, Writer, Rewriter e Proofreader supportano solo la modalità da testo a testo. L' API Prompt ha funzionalità multimodali.
I modelli in Chrome
Chrome utilizza modelli linguistici esperti e di base. Questi modelli non sono disponibili sui dispositivi mobili.
A partire da Chrome 149, i modelli supportano inglese, spagnolo, giapponese, tedesco e francese per il testo di input e output.
Hardware
Esistono i seguenti requisiti per gli sviluppatori e gli utenti che utilizzano le funzionalità che utilizzano queste API in Chrome. Altri browser potrebbero avere requisiti operativi diversi.
Le API Language Detector e Translator funzionano in Chrome su computer desktop. Queste API non funzionano sui dispositivi mobili.
Le API Prompt, Summarizer, Writer, Rewriter e Proofreader funzionano in Chrome quando vengono soddisfatte le seguenti condizioni:
- Sistema operativo: Windows 10 o 11; macOS 13+ (Ventura e versioni successive); Linux; o ChromeOS (a partire dalla piattaforma 16389.0.0 e versioni successive) sui Chromebook Plus dispositivi. Chrome per Android, iOS e ChromeOS sui dispositivi non Chromebook Plus non è ancora supportato dalle API che utilizzano modelli di base.
- Spazio di archiviazione: almeno 22 GB di spazio libero sul volume che contiene il profilo Chrome.
- GPU o CPU: i modelli integrati possono essere eseguiti con GPU o CPU.
- GPU: rigorosamente più di 4 GB di VRAM.
- CPU: almeno 16 GB di RAM e almeno 4 core CPU.
- Nota: l'API Prompt con input audio richiede una GPU.
- Rete: dati illimitati o una connessione non a consumo.
Le dimensioni esatte di Gemini Nano possono variare man mano che il browser aggiorna il modello. Per determinare le dimensioni attuali, visita chrome://on-device-internals.
Inizia a creare
Sono disponibili diverse API AI integrate in varie fasi di sviluppo. Alcune sono in Chrome stabile, altre sono disponibili per i partecipanti alle prove dell'origine e altre ancora sono disponibili solo per i partecipanti al programma di anteprima.
Ogni API ha il proprio insieme di istruzioni per iniziare e scaricare il modello, sia per la prototipazione locale sia negli ambienti di produzione con le prove dell'origine.
- API Translator
- API Language Detector
- API Summarizer
- API Writer e API Rewriter
- API Proofreader
- API Prompt
Tutte queste API possono essere utilizzate durante la creazione di estensioni di Chrome.
Download modello
Le API sono integrate in Chrome, così come i modelli. La prima volta che un utente interagisce con queste API, il modello deve essere scaricato nel browser.
Per determinare se un'API è utilizzabile e pronta, chiama la funzione asincrona availability(), che restituisce una promessa con uno dei seguenti valori:
"unavailable": il dispositivo dell'utente o le opzioni di sessione richieste non sono supportate. Il dispositivo potrebbe avere alimentazione o spazio su disco insufficienti."downloadable": sono necessari download aggiuntivi per creare una sessione, che può includere un modello esperto, un modello linguistico o un'ottimizzazione. L'attivazione dell'utente potrebbe essere necessaria per chiamarecreate()."downloading": i download sono in corso e devono essere completati prima di poter utilizzare una sessione."available": puoi creare una sessione immediatamente.
Alcune API richiedono opzioni aggiuntive quando si chiama la disponibilità. Ad esempio, l'API Prompt richiede la dichiarazione del supporto linguistico:
// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });
Attivazione utente
Se il dispositivo è in grado di supportare le API AI integrate, ma il modello non è ancora stato scaricato, l'utente deve interagire in modo significativo con la pagina affinché l'applicazione possa avviare una sessione con create().
Utilizza la UserActivation.isActive
proprietà per verificare che un utente abbia interagito direttamente con la pagina dopo il completamento del caricamento. Può trattarsi di un tocco, un clic, una pressione di un tasto, mousedown, o
altri eventi di attivazione persistenti.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
Ad esempio, con l'API Summarizer, puoi
chiedere agli utenti di interagire con un pulsante con la dicitura "Riassumi" per attivare
Summarizer.create(), oppure puoi creare il riassunto una volta che l'utente ha iniziato a
digitare, un evento keydown.
Utilizzare le API su localhost
Tutte le API sono disponibili su localhost in Chrome.
- Vai a
chrome://flags/#optimization-guide-on-device-model. - Seleziona Attivato.
- Fai clic su Riavvia o riavvia Chrome.
Per le API che utilizzano Gemini Nano, devi anche impostare chrome://flags/#prompt-api-for-gemini-nano su Attivato o Attivato multilingue. Puoi verificare che il modello sia stato scaricato e funzioni
come previsto nella console DevTools.
Esegui await LanguageModel.availability(); nella console.
Risolvere i problemi di localhost
Se i flag non vengono visualizzati in chrome://flags, assicurati di aver scaricato
la versione più recente di Chrome.
Se il modello non funziona come previsto, segui questi passaggi:
- Riavvia Chrome.
- Vai a
chrome://on-device-internals. - Seleziona la scheda Stato modello e assicurati che non siano presenti errori.
- Apri DevTools e digita
LanguageModel.availability();nella console. Dovrebbe essere restituitoavailable.
Se necessario, attendi un po' di tempo e ripeti questi passaggi.
Processo di standardizzazione
Stiamo lavorando per standardizzare queste API, in modo che funzionino su tutti i browser. Ciò significa che abbiamo proposto le API a la community delle piattaforme web e le abbiamo spostate nel gruppo della community W3C Web Incubator per ulteriori discussioni.
Stiamo richiedendo feedback a W3C, Mozilla e WebKit per ogni API.
Interagisci e condividi feedback
Se provi l'AI integrata e hai feedback, non esitare a comunicarcelo.
- Scopri tutte le API AI integrate.
- Partecipa al programma di anteprima per visualizzare in anteprima le nuove API e accedere alla nostra mailing list.
- Se hai feedback sull'implementazione di Chrome, segnala un bug di Chromium.
- Scopri di più sugli standard web.