Понимание встроенного управления моделями в Chrome

Опубликовано: 21 октября 2025 г.

Встроенные возможности искусственного интеллекта (ИИ) в Gemini Nano разработаны для удобства пользователей и разработчиков. При использовании встроенного API искусственного интеллекта управление моделями происходит автоматически в фоновом режиме. В этом документе описывается, как Chrome обрабатывает загрузку, обновление и удаление моделей Gemini Nano.

Первоначальная загрузка модели

Когда пользователь загружает или обновляет Chrome, Gemini Nano загружается по запросу , чтобы гарантировать загрузку Chrome правильной модели для оборудования пользователя. Первоначальная загрузка модели инициируется первым вызовом функции *.create() (например, Summarizer.create() ) любого встроенного API искусственного интеллекта , зависящего от Gemini Nano. При этом Chrome выполняет серию проверок, чтобы определить оптимальный вариант действий. Сначала Chrome оценивает производительность графического процессора устройства, запуская репрезентативный шейдер. На основе этих результатов он решает:

  • Загрузите более крупный и производительный вариант Gemini Nano (например, с параметрами 4B).
  • Загрузите меньший и более эффективный вариант Gemini Nano (например, параметры 2B).
  • Если устройство соответствует отдельным статическим требованиям, возвращается к выводу на основе ЦП . Если устройство не соответствует аппаратным требованиям , модель не загружается.

Процесс загрузки построен так, чтобы быть отказоустойчивым:

  • В случае прерывания интернет-соединения загрузка продолжится с того места, где она была прервана, как только соединение восстановится.
  • Если вкладка, запустившая загрузку, закрыта, загрузка продолжается в фоновом режиме.
  • Если браузер закрыт, загрузка возобновится при следующем перезапуске, при условии, что браузер откроется в течение 30 дней.

Иногда вызов availability() может запустить загрузку модели. Это происходит, если вызов происходит вскоре после создания нового профиля пользователя и если активирована функция обнаружения мошенничества на базе Gemini Nano .

Загрузка весов LoRA

Некоторые API, например, Proofreader API, используют веса низкоранговой адаптации (LoRA), применяемые к базовой модели для специализации её функций. Если API зависит от LoRA, веса LoRA загружаются вместе с базовой моделью. Веса LoRA для других API не загружаются заранее.

Автоматические обновления модели

Обновления для модели Gemini Nano выпускаются регулярно. Chrome проверяет наличие этих обновлений при запуске браузера. Кроме того, Chrome ежедневно проверяет наличие обновлений для дополнительных ресурсов, таких как весовые коэффициенты LoRA. Хотя программно запросить версию модели из JavaScript невозможно, можно вручную проверить установленную версию на chrome://on-device-internals . Процесс обновления разработан таким образом, чтобы быть плавным и не прерывать работу:

  • Chrome продолжает работать с текущей моделью, одновременно загружая новую версию в фоновом режиме.
  • После загрузки обновлённой модели происходит её горячая замена , то есть переключение моделей происходит без простоя . Любой новый вызов API ИИ будет немедленно использовать новую модель. Примечание: возможен сбой запроса, запущенного непосредственно в момент замены.
  • Каждое обновление представляет собой полную, а не частичную загрузку новой модели. Это связано с тем, что веса моделей могут значительно различаться в разных версиях, а вычисление и применение дельт для таких больших файлов может быть медленным.

Обновления подчиняются тем же требованиям, что и первоначальная загрузка. Однако первоначальная проверка дискового пространства не требуется, если модель уже установлена. Веса LoRA также можно обновить. Новую версию весов LoRA можно применить к существующей базовой модели. Однако для новой версии базовой модели всегда требуется новый набор весов LoRA.

Удаление модели

Chrome активно управляет дисковым пространством, чтобы пользователь не исчерпал его. Модель Gemini Nano автоматически удаляется, если свободное дисковое пространство на устройстве опускается ниже определённого порога. Кроме того, модель удаляется, если корпоративная политика отключает эту функцию или если пользователь не соответствует другим критериям соответствия в течение 30 дней. Критерии соответствия могут включать использование API и характеристики устройства. Процесс удаления имеет следующие характеристики:

  • Модель можно удалить в любой момент, даже в середине сеанса, независимо от текущих запросов. Это означает, что API, доступный в начале сеанса, может внезапно стать недоступным.
  • После очистки модель не загружается автоматически повторно. Новая загрузка должна быть инициирована приложением, вызывающим функцию *.create() .
  • При очистке базовой модели все связанные с ней веса LoRA также очищаются по истечении 30-дневного льготного периода.

Ваша роль в управлении моделями

Хорошее понимание жизненного цикла встроенной модели ИИ — ключ к созданию правильного пользовательского опыта. Не стоит ограничиваться одной загрузкой модели, нужно также учитывать возможность её внезапного исчезновения из-за нехватки места на диске или необходимость её обновления при выходе новой версии. Обо всём этом заботится браузер.

Соблюдая рекомендации по загрузке модели , вы обеспечите положительный пользовательский опыт при первоначальной загрузке, повторных загрузках и обновлениях.