Información sobre la administración de modelos integrada en Chrome

Thomas Steiner

Publicado: 21 de octubre de 2025

Las capacidades integradas de IA potenciadas por Gemini Nano están diseñadas para ser fluidas tanto para los usuarios como para los desarrolladores. Cuando usas una API de IA integrada, la administración del modelo se realiza automáticamente en segundo plano. En este documento, se describe cómo Chrome controla las descargas, las actualizaciones y las purgas del modelo de Gemini Nano.

Descarga inicial del modelo

Cuando un usuario descarga o actualiza Chrome, Gemini Nano se descarga a pedido para garantizar que Chrome descargue el modelo correcto para el hardware del usuario. La primera llamada a una función *.create() (por ejemplo, Summarizer.create()) de cualquier API de IA integrada que dependa de Gemini Nano activa la descarga inicial del modelo. Cuando esto sucede, Chrome ejecuta una serie de verificaciones para determinar el mejor curso de acción. Primero, Chrome estima el rendimiento de la GPU del dispositivo ejecutando un sombreador representativo. Según estos resultados, decide si debe hacer lo siguiente:

Descarga una variante más grande y potente de Gemini Nano (como la de 4, 000 millones de parámetros).
Descarga una variante más pequeña y eficiente de Gemini Nano (como la de 2, 000 millones de parámetros).
Recurre a la inferencia basada en la CPU si el dispositivo cumple con requisitos estáticos independientes. Si el dispositivo no cumple con los requisitos de hardware, no se descargará el modelo.

El proceso de descarga está diseñado para ser resiliente:

Si se interrumpe la conexión a Internet, la descarga continúa desde donde se detuvo una vez que se restablece la conectividad.
Si se cierra la pestaña que activó la descarga, esta continúa en segundo plano.
Si se cierra el navegador, la descarga se reanudará en el próximo reinicio, siempre que el navegador se abra en un plazo de 30 días.

A veces, llamar a availability() puede activar la descarga del modelo. Esto ocurre si la llamada se realiza poco después de que se inicia un perfil de usuario nuevo y si la función de detección de estafas potenciada por Gemini Nano está activa.

Descarga de pesos de LoRA

Algunas APIs, como la API de Proofreader, se basan en pesos de adaptación de bajo rango (LoRA) que se aplican al modelo base para especializar su función. Si la API depende de LoRA, los pesos de LoRA se descargan junto con el modelo base. Los pesos de LoRA para otras APIs no se descargan de forma proactiva.

Actualizaciones automáticas del modelo

Las actualizaciones del modelo de Gemini Nano se lanzan con regularidad. Chrome busca estas actualizaciones cuando se inicia el navegador. Además, Chrome busca actualizaciones de recursos complementarios, como los pesos de LoRA, todos los días. Si bien no puedes consultar la versión del modelo de forma programática desde JavaScript, puedes verificar manualmente qué versión está instalada en chrome://on-device-internals. El proceso de actualización está diseñado para ser fluido y no causar interrupciones:

Chrome sigue funcionando con el modelo actual mientras descarga la nueva versión en segundo plano.
Una vez que se descarga el modelo actualizado, se intercambia en caliente, lo que significa que los modelos se cambian sin tiempo de inactividad. Cualquier llamada nueva a la API de IA usará inmediatamente el nuevo modelo. Nota: Es posible que falle un mensaje que se ejecute en el momento exacto del intercambio.
Cada actualización es una descarga completa de un modelo nuevo, no una descarga parcial. Esto se debe a que los pesos del modelo pueden ser muy diferentes entre las versiones, y calcular y aplicar deltas para archivos tan grandes puede ser lento.

Las actualizaciones están sujetas a los mismos requisitos que la descarga inicial. Sin embargo, se omite la verificación inicial del espacio en disco si ya hay un modelo instalado. También se pueden actualizar los pesos de LoRA. Se puede aplicar una nueva versión de los pesos de LoRA a un modelo base existente. Sin embargo, una nueva versión del modelo base siempre requiere un nuevo conjunto de pesos de LoRA.

Borrado del modelo

Chrome administra de forma activa el espacio en disco para garantizar que el usuario no se quede sin espacio. El modelo de Gemini Nano se borra automáticamente si el espacio libre en el disco del dispositivo cae por debajo de un cierto umbral. Además, el modelo se borra si una política empresarial inhabilita la función o si un usuario no cumple con otros criterios de elegibilidad durante 30 días. La elegibilidad puede incluir el uso de la API y la capacidad del dispositivo. El proceso de eliminación tiene las siguientes características:

El modelo se puede borrar en cualquier momento, incluso durante la sesión, sin tener en cuenta las instrucciones en ejecución. Esto significa que una API que estaba disponible al comienzo de una sesión podría dejar de estarlo de repente.
Después de borrarse definitivamente, el modelo no se vuelve a descargar automáticamente. Una aplicación que llama a una función *.create() debe activar una descarga nueva.
Cuando se borra el modelo base, también se borran los pesos de LoRA relacionados después de un período de gracia de 30 días.

Tu rol en la administración de modelos

Comprender bien el ciclo de vida del modelo de IA integrado es clave para lograr una buena experiencia del usuario. No solo debes descargar el modelo una vez, sino que también debes tener en cuenta la posibilidad de que desaparezca repentinamente debido a la falta de espacio en el disco o de que se actualice cuando salga una versión nueva. El navegador se encarga de todo esto.

Si sigues las prácticas recomendadas para descargar el modelo, crearás una buena experiencia del usuario en la descarga inicial, las descargas repetidas y las actualizaciones.

Información sobre la administración de modelos integrada en Chrome Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.