Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

瞭解 Chrome 的內建模型管理功能

Thomas Steiner

發布日期：2025 年 10 月 21 日

內建 AI 功能由基礎模型和專家模型提供技術支援，可為使用者和開發人員帶來流暢體驗。使用內建 AI API 時，系統會在背景自動管理模型。本文說明 Chrome 如何處理 AI 模型下載、更新和清除作業。

初始模型下載

使用者下載或更新 Chrome 時，系統會視需求下載模型，確保 Chrome 下載適合使用者硬體的模型。首次呼叫任何內建 AI API 的 *.create() 函式 (例如 Summarizer.create())，就會觸發初始模型下載作業。發生這種情況時，Chrome 會執行一系列檢查，判斷最佳做法。首先，Chrome 會執行代表性的著色器，估算裝置的 GPU 效能。根據這些結果，系統會決定：

下載功能更強大的 Gemini Nano 變體版本 (例如 40 億個參數)。
下載更小巧高效的 Gemini Nano 變體 (例如 2B 參數)。
如果裝置符合其他靜態需求，請改用以 CPU 為基礎的推論。如果裝置不符合硬體需求，系統就不會下載模型。

下載程序具有高韌性：

如果網路連線中斷，系統會在連線恢復後，從中斷的地方繼續下載。
如果關閉觸發下載的分頁，下載作業會在背景繼續進行。
如果關閉瀏覽器，只要在 30 天內重新開啟，下載作業就會繼續。

有時呼叫 availability() 會觸發模型下載作業。如果通話是在新的使用者設定檔啟動後不久進行，且詐騙偵測功能 (由 Gemini Nano 提供支援) 處於啟用狀態，就會發生這種情況。

下載 LoRA 權重

部分 API (例如 Proofreader API) 會使用套用至基礎模型的低階適應 (LoRA) 權重，以專門執行特定功能。如果 API 依附於 LoRA，系統會連同基礎模型一併下載 LoRA 權重。系統不會主動下載其他 API 的 LoRA 權重。

自動更新模型

我們會定期發布 Gemini Nano 模型更新。Chrome 會在瀏覽器啟動時檢查這些更新。此外，Chrome 每天都會檢查 LoRA 權重等補充資源的更新。雖然無法透過 JavaScript 以程式輔助方式查詢模型版本，但可以手動檢查 chrome://on-device-internals 上安裝的版本。更新程序不會中斷服務，而且設計上相當順暢：

Chrome 會繼續使用目前模型運作，同時在背景下載新版本。
下載更新模型後，系統會熱交換模型，也就是不會停機就切換模型。所有新的 AI API 呼叫都會立即使用新模型。注意：如果提示在切換的當下執行，可能會失敗。
每次更新都會下載完整的新模型，而非部分下載。這是因為不同版本之間的模型權重可能差異很大，而計算及套用這類大型檔案的差異可能很慢。

更新須符合與初始下載相同的規定。不過，如果已安裝模型，系統會略過初始磁碟空間檢查。LoRA 權重也可以更新。您可以將新版 LoRA 權重套用至現有基礎模型。不過，新版基礎模型一律需要一組新的 LoRA 權重。

刪除模型

Chrome 會主動管理磁碟空間，確保使用者不會用盡空間。如果裝置的可用磁碟空間低於特定門檻，系統就會自動刪除 Gemini Nano 模型。此外，如果企業政策停用這項功能，或是使用者在 30 天內未符合其他資格條件，系統也會清除模型。資格條件可能包括 API 用量和裝置功能。清除程序具有下列特性：

你隨時可以刪除模型，即使是在工作階段中途也沒問題，系統不會考量正在執行的提示。也就是說，工作階段開始時可用的 API 可能會突然無法使用。
模型清除後不會自動重新下載。應用程式必須呼叫 *.create() 函式，才能觸發新的下載作業。
基礎模型遭到清除後，相關的 LoRA 權重也會在 30 天的寬限期過後遭到清除。

您在模型管理中的角色

充分瞭解內建 AI 模型的生命週期，是打造優質使用者體驗的關鍵。您不只要下載模型一次，還需要注意模型可能會因磁碟空間不足而突然消失，或在推出新版本時更新模型。瀏覽器會處理這一切。

請按照模型下載最佳做法操作，確保使用者在初始下載、重新下載和更新時，都能享有良好的體驗。

瞭解 Chrome 的內建模型管理功能 透過集合功能整理內容 你可以依據偏好儲存及分類內容。