發布日期:2025 年 10 月 21 日
內建的 AI 功能由 Gemini Nano 提供技術支援,可為使用者和開發人員帶來無縫體驗。使用內建 AI API 時,模型管理作業會在背景自動進行。本文說明 Chrome 如何處理 Gemini Nano 模型下載、更新和清除作業。
下載初始模型
使用者下載或更新 Chrome 時,系統會視需要下載 Gemini Nano,確保 Chrome 下載適合使用者硬體的模型。首次呼叫任何內建 AI API 的 *.create()
函式 (例如 Summarizer.create()
),就會觸發初始模型下載作業。發生這種情況時,Chrome 會執行一系列檢查,判斷最佳做法。首先,Chrome 會執行代表性的著色器,估算裝置的 GPU 效能。根據這些結果,系統會決定是否要:
- 下載功能更強大的 Gemini Nano 變體版本 (例如 4B 參數)。
- 下載更小巧高效的 Gemini Nano 變體 (例如 2B 參數)。
- 如果裝置符合其他靜態需求,請改用以 CPU 為基礎的推論。如果裝置不符合硬體需求,系統就不會下載模型。
下載程序具有高韌性:
- 如果網路連線中斷,系統會在連線恢復後,從中斷處繼續下載。
- 如果關閉觸發下載的分頁,下載作業會在背景繼續進行。
- 如果關閉瀏覽器,只要在 30 天內重新啟動瀏覽器,下載作業就會繼續。
有時呼叫 availability()
會觸發模型下載作業。如果通話是在新的使用者設定檔啟動後不久進行,且Gemini Nano 詐騙偵測功能已啟用,就會發生這種情況。
下載 LoRA 權重
部分 API (例如 Proofreader API) 會使用套用至基礎模型的低階適應 (LoRA) 權重,以專門執行特定功能。如果 API 依附於 LoRA,系統會連同基礎模型一併下載 LoRA 權重。系統不會主動下載其他 API 的 LoRA 權重。
自動更新模型
我們會定期發布 Gemini Nano 模型更新。Chrome 會在瀏覽器啟動時檢查這些更新。此外,Chrome 每天都會檢查 LoRA 權重等補充資源的更新。雖然您無法透過 JavaScript 以程式輔助方式查詢模型版本,但可以手動檢查 chrome://on-device-internals
上安裝的版本。更新程序不會中斷服務,而且十分順暢:
- Chrome 會繼續使用目前的模型運作,同時在背景下載新版本。
- 下載更新後的模型後,系統會熱交換模型,也就是不會停機就切換模型。所有新的 AI API 呼叫都會立即使用新模型。注意:如果提示在切換的當下執行,可能會失敗。
- 每次更新都會下載完整的新模型,而非部分下載。這是因為不同版本之間的模型權重可能差異很大,而計算及套用這類大型檔案的差異可能很慢。
更新時須符合與初始下載相同的規定。不過,如果已安裝模型,系統會略過初始磁碟空間檢查。LoRA 權重也可以更新。您可以將新版 LoRA 權重套用至現有基礎模型。不過,新版基礎模型一律需要一組新的 LoRA 權重。
刪除模型
Chrome 會主動管理磁碟空間,確保使用者不會用盡空間。如果裝置的可用磁碟空間低於特定門檻,系統就會自動刪除 Gemini Nano 模型。此外,如果企業政策停用這項功能,或是使用者在 30 天內未符合其他資格條件,系統也會清除模型。資格條件可能包括 API 使用情況和裝置功能。清除程序具有下列特性:
- 你隨時可以刪除模型,即使是在工作階段中途也沒問題,系統不會理會正在執行的提示。也就是說,工作階段開始時可用的 API 可能會突然無法使用。
- 模型清除後不會自動重新下載。應用程式必須呼叫
*.create()
函式,才能觸發新的下載作業。 - 清除基礎模型後,相關的 LoRA 權重也會在 30 天的寬限期過後一併清除。
您在模型管理中的角色
充分瞭解內建 AI 模型的生命週期,是打造優質使用者體驗的關鍵。您不只要下載模型一次,還需要注意模型可能會在磁碟空間不足時突然消失,或是在新版本推出時更新。瀏覽器會處理所有相關事宜。
請按照下載模型的最佳做法,在初始下載、重新下載和更新時,為使用者提供良好的體驗。