Deze pagina is vertaald door de Cloud Translation API.

Inzicht in ingebouwd modelbeheer in Chrome

Thomas Steiner

Gepubliceerd: 21 oktober 2025

De ingebouwde AI-mogelijkheden van Gemini Nano zijn ontworpen voor naadloze integratie met zowel gebruikers als ontwikkelaars. Wanneer u een ingebouwde AI API gebruikt, vindt het modelbeheer automatisch op de achtergrond plaats. Dit document beschrijft hoe Chrome omgaat met het downloaden, bijwerken en verwijderen van Gemini Nano-modellen.

Initieel model downloaden

Wanneer een gebruiker Chrome downloadt of bijwerkt, wordt Gemini Nano op aanvraag gedownload om ervoor te zorgen dat Chrome het juiste model voor de hardware van de gebruiker downloadt. De initiële modeldownload wordt geactiveerd door de eerste aanroep van een *.create() functie (bijvoorbeeld Summarizer.create() ) van een ingebouwde AI API die afhankelijk is van Gemini Nano. Wanneer dit gebeurt, voert Chrome een reeks controles uit om de beste handelwijze te bepalen. Eerst schat Chrome de GPU-prestaties van het apparaat door een representatieve shader uit te voeren. Op basis van deze resultaten besluit Chrome om:

Download een grotere, krachtigere Gemini Nano-variant (bijvoorbeeld 4B-parameters).
Download een kleinere, efficiëntere Gemini Nano-variant (zoals 2B-parameters).
Terugvallen op CPU-gebaseerde inferentie als het apparaat aan afzonderlijke statische vereisten voldoet. Als het apparaat niet aan de hardwarevereisten voldoet, wordt het model niet gedownload.

Het downloadproces is veerkrachtig opgebouwd:

Als de internetverbinding wordt verbroken, wordt het downloaden hervat vanaf het punt waar het was gestopt, zodra de verbinding is hersteld.
Als het tabblad dat de download heeft geactiveerd, gesloten is, gaat de download op de achtergrond verder.
Als de browser gesloten is, wordt het downloaden hervat wanneer u de browser opnieuw opstart, op voorwaarde dat u de browser binnen 30 dagen opnieuw opent.

Soms kan het aanroepen van availability() de download van het model activeren. Dit gebeurt als de aanroep kort na het opstarten van een nieuw gebruikersprofiel plaatsvindt en als de Gemini Nano-functie voor oplichtingsdetectie actief is.

LoRA-gewichten downloaden

Sommige API's, zoals de Proofreader API, vertrouwen op Low-Rank Adaptation (LoRA)-gewichten die op het basismodel worden toegepast om de functie te specialiseren. Als de API afhankelijk is van LoRA, worden de LoRA-gewichten samen met het basismodel gedownload. LoRA-gewichten voor andere API's worden niet proactief gedownload.

Automatische modelupdates

Updates voor het Gemini Nano-model worden regelmatig uitgebracht. Chrome controleert op deze updates wanneer de browser wordt opgestart. Daarnaast controleert Chrome dagelijks op updates voor aanvullende bronnen, zoals LoRA-gewichten. Hoewel u de modelversie niet programmatisch kunt opvragen vanuit JavaScript, kunt u handmatig controleren welke versie is geïnstalleerd op chrome://on-device-internals . Het updateproces is ontworpen om naadloos en zonder onderbrekingen te verlopen:

Chrome blijft met het huidige model werken terwijl de nieuwe versie op de achtergrond wordt gedownload.
Zodra het bijgewerkte model is gedownload, wordt het hot-swapt . Dit betekent dat de modellen zonder downtime worden gewisseld. Elke nieuwe AI API-aanroep gebruikt direct het nieuwe model. Let op: het is mogelijk dat een prompt die op het exacte moment van de wissel wordt uitgevoerd, mislukt.
Elke update is een volledige download van een nieuw model, geen gedeeltelijke download. Dit komt doordat modelgewichten aanzienlijk kunnen verschillen tussen versies, en het berekenen en toepassen van delta's voor zulke grote bestanden traag kan zijn.

Updates zijn onderworpen aan dezelfde vereisten als de eerste download. De initiële schijfruimtecontrole vervalt echter als een model al is geïnstalleerd. LoRA-gewichten kunnen ook worden bijgewerkt. Een nieuwe versie van LoRA-gewichten kan worden toegepast op een bestaand basismodel. Een nieuwe versie van een basismodel vereist echter altijd een nieuwe set LoRA-gewichten.

Modelverwijdering

Chrome beheert actief de schijfruimte om ervoor te zorgen dat de gebruiker niet zonder komt te zitten. Het Gemini Nano-model wordt automatisch verwijderd als de vrije schijfruimte van het apparaat onder een bepaalde drempelwaarde komt. Daarnaast wordt het model opgeschoond als een bedrijfsbeleid de functie uitschakelt of als een gebruiker gedurende 30 dagen niet aan andere geschiktheidscriteria heeft voldaan. Geschiktheid kan API-gebruik en de functionaliteit van het apparaat omvatten. Het opschoonproces heeft de volgende kenmerken:

Het model kan op elk moment worden verwijderd, zelfs midden in een sessie, ongeacht de actieve prompts. Dit betekent dat een API die beschikbaar was aan het begin van een sessie, plotseling niet meer beschikbaar kan zijn.
Nadat het model is verwijderd, wordt het niet automatisch opnieuw gedownload. Een nieuwe download moet worden geactiveerd door een applicatie die een *.create() -functie aanroept.
Wanneer het basismodel wordt verwijderd, worden alle gerelateerde LoRA-gewichten ook verwijderd na een respijtperiode van 30 dagen.

Jouw rol in modelbeheer

Een goed begrip van de levenscyclus van het ingebouwde AI-model is essentieel voor een optimale gebruikerservaring. Je hoeft het model niet één keer te downloaden, je moet er ook rekening mee houden dat het model plotseling weer kan verdwijnen als de schijfruimte te beperkt is, of dat het model kan worden bijgewerkt wanneer er een nieuwe versie uitkomt. Dit wordt allemaal door de browser geregeld.

Door de best practices voor het downloaden van het model te volgen, creëert u een goede gebruikerservaring bij de eerste download, herdownloads en updates.

Inzicht in ingebouwd modelbeheer in Chrome Stay organized with collections Save and categorize content based on your preferences.