內建 AI

Kenji Baheux
Kenji Baheux
Alexandra Klepper
Alexandra Klepper

發布日期:2024 年 5 月 14 日

在網路上使用 AI 模型建構功能時,我們通常會使用伺服器端解決方案來處理大型模型。對生成式 AI 而言更是如此 就算是最小的 1,000 個模型 網頁大小中位數。 其他 AI 用途也是如此,模型的大小可能介於 10 到 100 MB 之間。

自這些模型 不會跨網站共用。 每個網站都必須在載入網頁時進行下載這對開發人員和使用者來說都是不切實際的解決方案

伺服器端 AI 非常適合在裝置端和混合式環境中執行, 方法各有各的強項。如果要 將模型大小和模型交付列入考量

因此,我們正在開發網頁平台 API 和瀏覽器功能,以便直接將 AI 模型 (包括大型語言模型 (LLM)) 整合至瀏覽器。其中包括 Gemini Nano,這是 Gemini 系列 LLM 中最有效率的版本,可在大多數現代桌上型電腦和筆記型電腦上執行本機運算。有了內建 AI 技術,您的網站或網頁應用程式就能執行 AI 技術輔助的作業,不必部署或管理自己的 AI 模型。

瞭解內建 AI 技術的優點、我們的導入計畫,以及如何 可以運用這項技術

搶先體驗

我們需要您的意見來塑造 API,確保 API 可滿足您的用途,並在與其他瀏覽器供應商討論標準化時提供參考。

加入早期搶先體驗計畫 針對早期內建 AI 構想提供意見回饋,並發掘測試機會 進行中的 API 作業

加入 Chrome AI 開發人員公開公告群組,即可在新的 API 推出時收到通知。

內建 AI 技術對網頁程式開發人員的好處

瀏覽器內建 AI 技術, 基礎和專家模型

比起裝置端 AI 您親自體驗,內建 AI 技術 以下優點:

  • 輕鬆部署:瀏覽器會在發布模型時考量裝置的功能,並管理模型的更新作業。這個 因此您不必自行下載或更新 更是如此您不必解決儲存空間淘汰、執行階段記憶體預算、服務成本和其他問題。
  • 硬體加速存取權:瀏覽器 AI 執行階段經過最佳化調整, 充分運用可用的硬體,例如 GPU、NPU,或掉落 然後傳回到 CPU因此,您的應用程式可在 裝置。

在裝置上執行的優點

有了內建 AI 方法,就能在裝置端輕鬆執行 AI 任務 進而帶來以下好處:

  • 在本機處理機密資料:裝置端 AI 可改善隱私權狀況。舉例來說,如果您要處理機密資料,可以為使用者提供端對端加密的 AI 功能。
  • 精簡的使用者體驗:在某些情況下,可能不需要往返到 伺服器表示您可以提供近乎即時的結果。裝置端 AI 的 可行的功能與使用體驗差不多。
  • 擴大 AI 存取權:使用者的裝置可承擔部分處理負載,以便使用更多功能。舉例來說,如果您在 提供付費 AI 功能,您可以搶先體驗裝置端 AI 功能 好讓潛在客戶在沒有提示的情況下 您可能要額外支付費用這種混合方式也能協助 推論成本,尤其是常用使用者流程
  • 離線 AI 使用情形:即使沒有實體,也能使用 AI 功能 網際網路連線。這表示你的網站和網頁應用程式可以正常運作 離線或變換連線方式

混合式 AI:裝置端和伺服器端

雖然裝置端 AI 可處理多種用途,但某些用途需要伺服器端支援。

舉例來說,您可能需要使用較大的模型,也可以支援 平台和裝置

您可以考慮採用混合方法,具體取決於:

  • 複雜度:特定且容易上手的用途,更容易透過裝置端 AI 技術支援。如果是複雜的用途,請考慮在伺服器端導入。
  • 彈性:預設使用伺服器端,當裝置離線或連線不穩定時,則使用裝置端。
  • 優雅的備用方案:採用內建 AI 的瀏覽器需要時間,部分模型可能無法使用,舊版或效能較低的裝置可能無法滿足執行所有模型的硬體需求。為這些使用者提供伺服器端 AI。

針對 Gemini 模型,您可以使用後端整合功能 (搭配 PythonGoNode.jsREST),也可以在網路應用程式中使用新的 Google AI 用戶端 SDK for Web 進行實作。

瀏覽器架構和 API

為了支援 Chrome 內建的 AI 技術,我們建立了基礎架構,可存取基礎和專家模型,以便在裝置上執行。這項基礎架構已支援創新的瀏覽器功能,例如「幫我寫作」,不久後也會支援裝置端 AI 的 API。

您主要會透過工作 API (例如翻譯 API 或摘要 API) 存取內建 AI 功能。工作 API 的設計目的,是針對指派作業執行推論,並使用最佳模型。

在 Chrome 中,這些 API 是專為使用 Gemini Nano 執行推論而設計, 微調或微調模型專為在大多數的新型裝置上執行而設計。 Gemini Nano 最適合用於語言相關用途 改變字詞型態或分類

此外,我們也打算提供探索性 API,讓您在本機進行實驗,並分享其他用途。

舉例來說,我們可能會提供以下資訊:

  • Prompt API:將以自然語言表達的任意工作傳送至內建的大型語言模型 (Chrome 中的 Gemini Nano)。
  • 微調 (LoRA) API:使用低秩調整微調模型權重,改善內建 LLM 在任務上的效能。
此圖表展示您的網站或應用程式如何使用工作和探索性網路平台 API 存取 Chrome 內建的模型。

使用內建 AI 的時機

我們預期內建 AI 技術可為您和使用者帶來下列好處:

  • AI 強化內容消費:包括摘要、翻譯、回答某些內容的問題、分類和描述。
  • AI 輔助內容創作:例如撰文輔助、校對、文法校正和改寫。

後續步驟

加入搶先體驗計畫, 試用早期內建的 AI API

在此期間,你可以瞭解如何透過以下項目,在 Google 伺服器中使用 Gemini Pro: 您的網站和網頁應用程式 Google AI JavaScript SDK 快速入門導覽課程