此页面由 Cloud Translation API 翻译。

通知用户模型下载情况

Thomas Steiner

发布时间：2025 年 10 月 1 日

在可以使用任何内置 AI API 之前，必须从网络下载底层模型和任何自定义项（例如微调），提取压缩数据，最后将其加载到内存中。本指南记录了一些最佳实践，可帮助您在用户等待下载时改善用户体验。

监控和分享下载进度

每个内置 AI API 都有一个 create() 函数来启动会话。create() 函数具有 monitor 选项，因此您可以访问下载进度并将其分享给用户。

虽然内置 AI API 是为客户端 AI 而构建的，可在浏览器和用户设备上处理数据，但有些应用允许在服务器上处理数据。您在模型下载进度中如何称呼用户取决于以下问题：数据处理是否必须仅在本地运行？如果值为 true，则表示您的应用仅为客户端应用。如果不是，您的应用可以使用混合实现。

仅限客户端

在某些情况下，需要进行客户端数据处理。例如，如果某医疗保健应用允许患者询问有关其个人信息的问题，那么该应用可能希望这些信息在用户设备上保持私密状态。用户必须等到模型和所有自定义设置下载完毕并准备就绪后，才能使用任何数据处理功能。

在这种情况下，如果模型尚不可用，您应向用户显示下载进度信息。

<style>
  progress[hidden] ~ label {
    display: none;
  }
</style>

<button type="button">Create LanguageModel session</button>
<progress hidden id="progress" value="0"></progress>
<label for="progress">Model download progress</label>

在下载内置模型期间，应用尚无法使用。

现在，为了让此功能正常运行，我们需要编写一些 JavaScript 代码。该代码首先将进度界面重置为初始状态（进度隐藏且为零），检查是否完全支持该 API，然后检查该 API 的可用性：

API 为 'unavailable'：您的应用无法在此设备上以客户端方式使用。提醒用户相应功能不可用。
API 为 'available'：可立即使用该 API，无需显示进度界面。
API 为 'downloadable' 或 'downloading'：下载完成后即可使用 API。显示进度指示器，并在每次触发 downloadprogress 事件时更新该指示器。下载完成后，显示不确定状态，向用户表明浏览器正在提取模型并将其加载到内存中。

const createButton = document.querySelector('.create');
const promptButton = document.querySelector('.prompt');
const progress = document.querySelector('progress');
const output = document.querySelector('output');

let sessionCreationTriggered = false;
let localSession = null;

const createSession = async (options = {}) => {
  if (sessionCreationTriggered) {
    return;
  }

  progress.hidden = true;
  progress.value = 0;

  try {
    if (!('LanguageModel' in self)) {
      throw new Error('LanguageModel is not supported.');
    }

    const availability = await LanguageModel.availability();
    if (availability === 'unavailable') {
      throw new Error('LanguageModel is not available.');
    }

    let modelNewlyDownloaded = false;
    if (availability !== 'available') {
      modelNewlyDownloaded = true;
      progress.hidden = false;
    }
    console.log(`LanguageModel is ${availability}.`);
    sessionCreationTriggered = true;

    const llmSession = await LanguageModel.create({
      monitor(m) {
        m.addEventListener('downloadprogress', (e) => {
          progress.value = e.loaded;
          if (modelNewlyDownloaded && e.loaded === 1) {
            // The model was newly downloaded and needs to be extracted
            // and loaded into memory, so show the undetermined state.
            progress.removeAttribute('value');
          }
        });
      },
      ...options,
    });

    sessionCreationTriggered = false;
    return llmSession;
  } catch (error) {
    throw error;
  } finally {
    progress.hidden = true;
    progress.value = 0;
  }
};

createButton.addEventListener('click', async () => {
  try {
    localSession = await createSession({
      expectedInputs: [{ type: 'text', languages: ['en'] }],
      expectedOutputs: [{ type: 'text', languages: ['en'] }],
    });
    promptButton.disabled = false;
  } catch (error) {
    output.textContent = error.message;
  }
});

promptButton.addEventListener('click', async () => {
  output.innerHTML = '';
  try {
    const stream = localSession.promptStreaming('Write me a poem');
    for await (const chunk of stream) {
      output.append(chunk);
    }
  } catch (err) {
    output.textContent = err.message;
  }
});

如果用户在模型正积极下载到浏览器时进入应用，进度界面会根据仍缺失的数据指示浏览器在下载过程中的位置。

客户端演示

不妨观看演示，了解此流程的实际应用。如果内置 AI API（在本示例中为 Prompt API）不可用，则无法使用该应用。如果仍需下载内置 AI 模型，系统会向用户显示进度指示器。您可以在 GitHub 上查看源代码。

混合实现

如果您偏好使用客户端 AI，但可以暂时将数据发送到云端，则可以设置混合实现。这意味着，用户可以立即体验相关功能，同时并行下载本地模型。下载模型后，动态切换到本地会话。

您可以针对混合使用任何服务器端实现，但最好在云端和本地都坚持使用相同的模型系列，以确保获得可比较的结果质量。 Gemini API 和 Web 应用使用入门重点介绍了 Gemini API 的各种方法。

在下载内置模型期间，应用会回退到云模型，并且已可使用。

混合演示

演示展示了此流程的实际效果。如果内置 AI API 不可用，演示会回退到云端中的 Gemini API。如果仍需下载内置模型，系统会向用户显示进度指示器，并且应用会在下载完成之前使用云端 Gemini API。查看 GitHub 上的完整源代码。

总结

您的应用属于哪个类别？您是否需要 100% 的客户端处理，还是可以使用混合方法？回答完此问题后，下一步是实现最适合您的模型下载策略。

请务必确保用户始终知道他们何时以及是否可以使用应用客户端，方法是按照本指南中的说明向他们显示模型下载进度。

请注意，这不仅仅是一次性挑战：如果浏览器因存储压力而清除模型，或者当有新模型版本可用时，浏览器需要再次下载模型。无论您采用客户端方法还是混合方法，都可以确保为用户打造尽可能出色的体验，并让浏览器处理其余事宜。