Опубликовано: 21 октября 2025 г.
Встроенные возможности ИИ, основанные на базовых и экспертных моделях, разработаны таким образом, чтобы быть удобными как для пользователей, так и для разработчиков. При использовании встроенного API ИИ управление моделями происходит автоматически в фоновом режиме. В этом документе описывается, как Chrome обрабатывает загрузку, обновление и удаление моделей ИИ.
Загрузка первой модели
Когда пользователь загружает или обновляет Chrome, модель загружается по запросу , чтобы гарантировать, что Chrome загрузит правильную модель для оборудования пользователя. Первоначальная загрузка модели запускается первым вызовом функции *.create() (например, Summarizer.create() ) любого встроенного API ИИ , зависящего от Gemini Nano. В этом случае Chrome выполняет ряд проверок, чтобы определить наилучший вариант действий. Сначала Chrome оценивает производительность графического процессора устройства, запуская репрезентативный шейдер. На основе этих результатов он принимает решение:
- Загрузите более крупную и функциональную версию Gemini Nano (например, с параметрами 4B).
- Загрузите более компактный и эффективный вариант Gemini Nano (например, с параметрами 2B).
- Если устройство соответствует отдельным статическим требованиям, происходит переход к выполнению вычислений на основе ЦП . Если устройство не соответствует аппаратным требованиям , модель не загружается.
Процесс загрузки разработан таким образом, чтобы быть отказоустойчивым:
- Если интернет-соединение прерывается, загрузка продолжается с того места, где она была прервана, после восстановления связи.
- Если вкладка, запустившая загрузку, закрыта, загрузка продолжится в фоновом режиме.
- Если браузер закрыт, загрузка возобновится при следующем перезапуске, при условии, что браузер будет открыт в течение 30 дней.
Иногда вызов функции availability() может инициировать загрузку модели. Это происходит, если вызов осуществляется вскоре после запуска нового профиля пользователя и если активна функция обнаружения мошенничества на базе Gemini Nano .
Загрузка весов LoRA
Некоторые API, например API для проверки орфографии, используют веса адаптации низкого ранга (LoRA), которые применяются к базовой модели для специализации её функций. Если API зависит от LoRA, веса LoRA загружаются вместе с базовой моделью. Веса LoRA для других API не загружаются автоматически.
Автоматическое обновление модели
Обновления для модели Gemini Nano выпускаются регулярно. Chrome проверяет наличие этих обновлений при запуске браузера. Кроме того, Chrome ежедневно проверяет наличие обновлений для дополнительных ресурсов, таких как веса LoRA. Хотя вы не можете программно запросить версию модели из JavaScript, вы можете вручную проверить, какая версия установлена, на chrome://on-device-internals . Процесс обновления разработан таким образом, чтобы быть незаметным и не прерывать работу системы:
- Chrome продолжает работать с текущей версией, одновременно загружая новую версию в фоновом режиме.
- После загрузки обновлённой модели происходит «горячая замена» , то есть модели переключаются без простоя . Любой новый вызов API ИИ будет немедленно использовать новую модель. Примечание: Возможно, что запрос, запущенный в момент замены, завершится с ошибкой.
- Каждое обновление представляет собой полную загрузку новой модели, а не частичную. Это связано с тем, что веса моделей могут значительно различаться между версиями, а вычисление и применение изменений для таких больших файлов может быть медленным процессом.
Обновления подчиняются тем же требованиям, что и первоначальная загрузка. Однако проверка наличия свободного места на диске не требуется, если модель уже установлена. Веса LoRA также можно обновить. Новую версию весов LoRA можно применить к существующей базовой модели. Однако для новой версии базовой модели всегда требуется новый набор весов LoRA.
Удаление модели
Chrome активно управляет дисковым пространством, чтобы пользователь не испытывал его нехватки. Модель Gemini Nano автоматически удаляется, если свободное дисковое пространство устройства падает ниже определенного порога. Кроме того, модель удаляется, если корпоративная политика отключает эту функцию или если пользователь не соответствует другим критериям приемлемости в течение 30 дней. Критерии приемлемости могут включать использование API и возможности устройства. Процесс удаления имеет следующие характеристики:
- Модель можно удалить в любое время, даже в середине сессии, независимо от текущих запросов. Это означает, что API, который был доступен в начале сессии, может внезапно стать недоступным.
- После удаления модель не загружается автоматически повторно. Новая загрузка должна быть инициирована приложением, вызвавшим функцию
*.create(). - При удалении базовой модели все связанные с ней весовые коэффициенты LoRA также удаляются после 30-дневного льготного периода.
Ваша роль в управлении моделями
Понимание жизненного цикла встроенной модели ИИ — ключ к правильному пользовательскому опыту. Загрузка модели не ограничивается одним разом; необходимо также учитывать возможность её внезапного исчезновения из-за нехватки места на диске или необходимости обновления при выходе новой версии. Обо всём этом позаботится браузер.
Следуя передовым методам загрузки модели , вы обеспечите удобство использования как при первой загрузке, так и при повторных загрузках и обновлениях.