Informazioni sulla gestione dei modelli integrata in Chrome

Data di pubblicazione: 21 ottobre 2025

Le funzionalità di AI integrata basate su Gemini Nano sono progettate per essere semplici da usare sia per gli utenti che per gli sviluppatori. Quando utilizzi un'API AI integrata, la gestione del modello avviene automaticamente in background. Questo documento descrive come Chrome gestisce i download, gli aggiornamenti e le eliminazioni del modello Gemini Nano.

Download del modello iniziale

Quando un utente scarica o aggiorna Chrome, Gemini Nano viene scaricato su richiesta per garantire che Chrome scarichi il modello corretto per l'hardware dell'utente. Il download iniziale del modello viene attivato dalla prima chiamata a una funzione *.create() (ad esempio Summarizer.create()) di qualsiasi API AI integrata che dipende da Gemini Nano. In questo caso, Chrome esegue una serie di controlli per determinare la migliore linea di condotta. Innanzitutto, Chrome stima le prestazioni della GPU del dispositivo eseguendo uno shader rappresentativo. In base a questi risultati, decide di:

  • Scarica una variante più grande e potente di Gemini Nano (ad esempio con 4 miliardi di parametri).
  • Scarica una variante più piccola ed efficiente di Gemini Nano (ad esempio con 2 miliardi di parametri).
  • Esegui il fallback all'inferenza basata sulla CPU se il dispositivo soddisfa requisiti statici separati. Se il dispositivo non soddisfa i requisiti hardware, il modello non viene scaricato.

La procedura di download è progettata per essere resiliente:

  • Se la connessione a internet viene interrotta, il download continua da dove si era interrotto una volta ristabilita la connettività.
  • Se la scheda che ha attivato il download viene chiusa, il download continua in background.
  • Se il browser viene chiuso, il download riprenderà al successivo riavvio, a condizione che il browser si apra entro 30 giorni.

A volte, chiamare il numero availability() può attivare il download del modello. Ciò si verifica se la chiamata avviene poco dopo l'avvio di un nuovo profilo utente e se la funzionalità di protezione antifrode basata su Gemini Nano è attiva.

Download dei pesi LoRA

Alcune API, come l'API Proofreader, si basano su pesi di adattamento a basso rango (LoRA) che vengono applicati al modello di base per specializzarne la funzione. Se l'API dipende da LoRA, i pesi LoRA vengono scaricati insieme al modello base. I pesi LoRA per altre API non vengono scaricati in modo proattivo.

Aggiornamenti automatici del modello

Gli aggiornamenti del modello Gemini Nano vengono rilasciati regolarmente. Chrome controlla la presenza di questi aggiornamenti all'avvio del browser. Inoltre, Chrome controlla quotidianamente la disponibilità di aggiornamenti per le risorse supplementari, come i pesi LoRA. Sebbene non sia possibile eseguire query a livello di programmazione sulla versione del modello da JavaScript, puoi controllare manualmente quale versione è installata su chrome://on-device-internals. La procedura di aggiornamento è progettata per essere fluida e non interrompere il lavoro:

  • Chrome continua a funzionare con il modello attuale durante il download della nuova versione in background.
  • Una volta scaricato il modello aggiornato, viene eseguito lo hot swap, il che significa che i modelli vengono scambiati senza tempi di inattività. Qualsiasi nuova chiamata API AI utilizzerà immediatamente il nuovo modello. Nota: è possibile che un prompt in esecuzione nell'esatto momento dello scambio non vada a buon fine.
  • Ogni aggiornamento è un download completo del nuovo modello, non un download parziale. Questo perché i pesi del modello possono essere molto diversi tra le versioni e il calcolo e l'applicazione dei delta per file così grandi possono essere lenti.

Gli aggiornamenti sono soggetti agli stessi requisiti del download iniziale. Tuttavia, il controllo iniziale dello spazio su disco non viene eseguito se è già installato un modello. Anche i pesi LoRA possono essere aggiornati. È possibile applicare una nuova versione dei pesi LoRA a un modello di base esistente. Tuttavia, una nuova versione del modello di base richiede sempre un nuovo insieme di pesi LoRA.

Eliminazione del modello

Chrome gestisce attivamente lo spazio su disco per garantire che l'utente non lo esaurisca. Il modello Gemini Nano viene eliminato automaticamente se lo spazio libero su disco del dispositivo scende al di sotto di una determinata soglia. Inoltre, il modello viene eliminato se un criterio aziendale disattiva la funzionalità o se un utente non soddisfa altri criteri di idoneità per 30 giorni. L'idoneità può includere l'utilizzo delle API e le funzionalità del dispositivo. Il processo di eliminazione ha le seguenti caratteristiche:

  • Il modello può essere eliminato in qualsiasi momento, anche a metà sessione, senza tenere conto dei prompt in esecuzione. Ciò significa che un'API disponibile all'inizio di una sessione potrebbe improvvisamente non essere più disponibile.
  • Dopo l'eliminazione, il modello non viene scaricato nuovamente in automatico. Un nuovo download deve essere attivato da un'applicazione che chiama una funzione *.create().
  • Quando il modello base viene eliminato, anche i pesi LoRA correlati vengono eliminati dopo un periodo di tolleranza di 30 giorni.

Il tuo ruolo nella gestione dei modelli

Comprendere bene il ciclo di vita del modello di AI integrato è fondamentale per ottenere la giusta esperienza utente. Il download del modello non è un'operazione da eseguire una sola volta. Devi anche tenere presente la possibilità che il modello scompaia di nuovo a causa della pressione dello spazio su disco o che venga aggiornato quando viene rilasciata una nuova versione. Tutto questo è gestito dal browser.

Se segui le best practice per il download del modello, creerai una buona esperienza utente durante il download iniziale, i download successivi e gli aggiornamenti.