發布日期:2024 年 12 月 12 日,上次更新日期:2025 年 5 月 20 日
透過內建的 AI API,您的網頁應用程式可以執行 AI 輔助工作,無須部署或管理自己的 AI 模型。我們正努力為這些 API 制定跨瀏覽器的標準。
需求條件
如要使用內建 AI,必須符合模型和硬體需求。
模型
Prompt API、Summarizer API、Writer API 和 Rewriter API 會下載大型語言模型,以便在桌上型電腦和筆記型電腦上在本機執行。這些 API 不適用於行動裝置。使用這些 API 前,請先詳閱並同意Google 的生成式 AI 使用限制政策。
Summarizer API、Writer API 和 Rewriter API 僅支援文字對文字模式。Prompt API 具有多模態功能,可供 Early Preview 計畫參與者進行本機原型設計。
硬體
開發人員和在 Chrome 中使用這些 API 運作功能的使用者,都必須遵守下列規定。其他瀏覽器的操作需求可能不同。
語言偵測器和翻譯器 API 適用於電腦版 Chrome。這些 API 不適用於行動裝置。在 Chrome 中使用 Prompt API、Summarizer API、Writer API 和 Rewriter API 時,須符合下列條件:
- 作業系統:Windows 10 或 11;macOS 13 以上版本 (Ventura 以上版本); Linux;或 ChromeOS (平台 16389.0.0 以上版本) 搭配 [Chromebook Plus](https://www.google.com/chromebook/chromebookplus/) 裝置。 使用 Gemini Nano 的 API 目前不支援 Android 版、iOS 版 Chrome,以及非 Chromebook Plus 裝置上的 ChromeOS。
- 儲存空間:包含 Chrome 設定檔的磁碟區至少要有 22 GB 的可用空間。
- GPU:VRAM 必須超過 4 GB。
- 網路:無限量數據或不計量的連線。
瀏覽器更新模型時,Gemini Nano 的確切大小可能會有所不同。如要判斷目前大小,請前往 chrome://on-device-internals
並前往「模型狀態」。開啟列出的「檔案路徑」,判斷模型大小。
開始建構
在開發的不同階段,您可以使用多種內建的 AI API。部分功能已在 Chrome 穩定版推出,部分功能則僅供來源試用計畫參與者使用,其他功能則僅供搶先預覽計畫參與者使用。
每個 API 都有專屬的入門和模型下載說明,適用於本機原型設計,以及透過原始碼試用功能在正式環境中進行原型設計。
- Translator API
- Language Detector API
- 摘要產生器 API
- 提示 API
- Chrome 擴充功能中的 Prompt API 含有特定說明,可協助擴充功能開發人員使用 Prompt API 建構擴充功能。
- Writer API 和 Rewriter API
建構 Chrome 擴充功能時,可以使用所有這些 API。
下載模型
API 和模型都內建於 Chrome。使用者首次與這些 API 互動時,必須將模型下載至瀏覽器。
如要判斷 API 是否可用,請呼叫非同步 availability()
函式,該函式會傳回含有下列其中一個值的 Promise:
"unavailable"
:使用者裝置或要求的工作階段選項不受支援。裝置的電量或磁碟空間可能不足。"downloadable"
:如要建立工作階段,需要額外下載內容,可能包括專家模型、語言模型或微調。您可能需要啟用使用者,才能呼叫create()
。"downloading"
:下載作業正在進行中,必須完成才能使用工作階段。"available"
:你可以立即建立工作階段。
啟用使用者
必須與使用者互動,才能將必要模型和設定下載至瀏覽器。如果使用者是第一次透過特定內建 AI API 與網站或網路應用程式互動,必須先進行暫時性使用者互動,才能透過 create()
啟動工作階段。
使用 UserActivation.isActive
` 屬性確認使用者啟用,這可能是點選、輕觸或按鍵。
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
舉例來說,您可以透過 Summarizer API,要求使用者與「摘要」按鈕互動,以啟動 Summarizer.create()
。
在本機主機上使用 API
所有 API 都可在 Chrome 的 localhost
中使用。
- 前往
chrome://flags/#prompt-api-for-gemini-nano
。 - 選取「已啟用」。
- 按一下「重新啟動」或重新啟動 Chrome。
如要確認 Gemini Nano 已下載並正常運作,請開啟開發人員工具,然後在控制台中輸入 await LanguageModel.availability();
。這應該會傳回 available
。
排解 localhost 問題
如果模型無法正常運作,請按照下列步驟操作:
- 重新啟動 Chrome。
- 前往
chrome://on-device-internals
。 - 選取「模型狀態」分頁標籤,確認沒有任何錯誤。
- 開啟開發人員工具,然後在控制台中輸入
LanguageModel.availability();
。這應該會傳回available
。
如有必要,請等待一段時間,然後重複上述步驟。
標準程序
我們正在為這些 API 制定標準,讓它們能在所有瀏覽器中運作。這表示我們已向網路平台社群提議使用這些 API,並將其移至 W3C Web Incubator Community Group,以供進一步討論。
我們正在向 W3C、Mozilla 和 WebKit 徵求各項 API 的意見。
參與討論及分享意見
如果您試用內建 AI 功能並有任何意見,歡迎與我們分享。
- 探索所有內建 AI API。
- 加入搶先預覽計畫,搶先瞭解新版 API 並加入郵寄清單。
- 如要對 Chrome 的實作方式提供意見,請回報 Chromium 錯誤。
- 瞭解網頁標準。