開始使用內建 AI 技術

Alexandra Klepper
Alexandra Klepper

發布日期:2024 年 12 月 12 日,上次更新日期:2025 年 5 月 20 日

透過內建的 AI API,您的網頁應用程式可以執行 AI 輔助工作,無須部署或管理自己的 AI 模型。我們正努力為這些 API 制定跨瀏覽器的標準

需求條件

如要使用內建 AI,必須符合模型和硬體需求。

模型

Prompt API、Summarizer API、Writer API 和 Rewriter API 會下載大型語言模型,以便在桌上型電腦和筆記型電腦上在本機執行。這些 API 不適用於行動裝置。使用這些 API 前,請先詳閱並同意Google 的生成式 AI 使用限制政策

Summarizer API、Writer API 和 Rewriter API 僅支援文字對文字模式。Prompt API 具有多模態功能,可供 Early Preview 計畫參與者進行本機原型設計。

硬體

開發人員和在 Chrome 中使用這些 API 運作功能的使用者,都必須遵守下列規定。其他瀏覽器的操作需求可能不同。

語言偵測器和翻譯器 API 適用於電腦版 Chrome。這些 API 不適用於行動裝置。在 Chrome 中使用 Prompt API、Summarizer API、Writer API 和 Rewriter API 時,須符合下列條件:

  • 作業系統:Windows 10 或 11;macOS 13 以上版本 (Ventura 以上版本); Linux;或 ChromeOS (平台 16389.0.0 以上版本) 搭配 [Chromebook Plus](https://www.google.com/chromebook/chromebookplus/) 裝置。 使用 Gemini Nano 的 API 目前不支援 Android 版、iOS 版 Chrome,以及非 Chromebook Plus 裝置上的 ChromeOS。
  • 儲存空間:包含 Chrome 設定檔的磁碟區至少要有 22 GB 的可用空間。
  • GPU:VRAM 必須超過 4 GB。
  • 網路:無限量數據或不計量的連線。

瀏覽器更新模型時,Gemini Nano 的確切大小可能會有所不同。如要判斷目前大小,請前往 chrome://on-device-internals 並前往「模型狀態」。開啟列出的「檔案路徑」,判斷模型大小。

開始建構

在開發的不同階段,您可以使用多種內建的 AI API。部分功能已在 Chrome 穩定版推出,部分功能則僅供來源試用計畫參與者使用,其他功能則僅供搶先預覽計畫參與者使用。

每個 API 都有專屬的入門和模型下載說明,適用於本機原型設計,以及透過原始碼試用功能在正式環境中進行原型設計。

建構 Chrome 擴充功能時,可以使用所有這些 API。

下載模型

API 和模型都內建於 Chrome。使用者首次與這些 API 互動時,必須將模型下載至瀏覽器。

如要判斷 API 是否可用,請呼叫非同步 availability() 函式,該函式會傳回含有下列其中一個值的 Promise:

  • "unavailable":使用者裝置或要求的工作階段選項不受支援。裝置的電量或磁碟空間可能不足。
  • "downloadable":如要建立工作階段,需要額外下載內容,可能包括專家模型、語言模型或微調。您可能需要啟用使用者,才能呼叫 create()
  • "downloading":下載作業正在進行中,必須完成才能使用工作階段。
  • "available":你可以立即建立工作階段。

啟用使用者

必須與使用者互動,才能將必要模型和設定下載至瀏覽器。如果使用者是第一次透過特定內建 AI API 與網站或網路應用程式互動,必須先進行暫時性使用者互動,才能透過 create() 啟動工作階段。

使用 UserActivation.isActive` 屬性確認使用者啟用,這可能是點選、輕觸或按鍵。

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

舉例來說,您可以透過 Summarizer API,要求使用者與「摘要」按鈕互動,以啟動 Summarizer.create()

在本機主機上使用 API

所有 API 都可在 Chrome 的 localhost 中使用。

  1. 前往chrome://flags/#prompt-api-for-gemini-nano
  2. 選取「已啟用」
  3. 按一下「重新啟動」或重新啟動 Chrome。

如要確認 Gemini Nano 已下載並正常運作,請開啟開發人員工具,然後在控制台中輸入 await LanguageModel.availability();。這應該會傳回 available

排解 localhost 問題

如果模型無法正常運作,請按照下列步驟操作:

  1. 重新啟動 Chrome。
  2. 前往chrome://on-device-internals
  3. 選取「模型狀態」分頁標籤,確認沒有任何錯誤。
  4. 開啟開發人員工具,然後在控制台中輸入 LanguageModel.availability();。這應該會傳回 available

如有必要,請等待一段時間,然後重複上述步驟。

標準程序

我們正在為這些 API 制定標準,讓它們能在所有瀏覽器中運作。這表示我們已向網路平台社群提議使用這些 API,並將其移至 W3C Web Incubator Community Group,以供進一步討論。

我們正在向 W3C、Mozilla 和 WebKit 徵求各項 API 的意見。

參與討論及分享意見

如果您試用內建 AI 功能並有任何意見,歡迎與我們分享。