Comece a usar a IA integrada

Alexandra Klepper
Alexandra Klepper

Publicado em 12 de dezembro de 2024, atualizado pela última vez em 20 de maio de 2025

Com APIs de IA integradas, seu aplicativo da Web pode realizar tarefas com tecnologia de IA sem precisar implantar ou gerenciar os próprios modelos de IA. Estamos trabalhando para padronizar essas APIs em todos os navegadores.

Requisitos

Para usar a IA integrada, há requisitos de modelo e hardware.

Modelos

As APIs Translator e Language Detector usam modelos de especialistas. Todas as outras APIs usam um modelo de linguagem projetado para ser executado localmente em computadores e laptops.

As APIs Summarizer, Writer, Rewriter e Proofreader só oferecem suporte à modalidade de texto para texto. A API Prompt tem recursos multimodais.

Gemini Nano no Chrome

O Chrome usa os modelos de linguagem do Gemini Nano. O Gemini Nano não está disponível em dispositivos móveis.

A partir do Chrome 140, o Gemini Nano oferece suporte a inglês, espanhol e japonês para texto de entrada e saída.

Antes de usar as APIs de IA integradas, reconheça a Política de uso proibido da IA generativa do Google.

Hardware

Os requisitos a seguir existem para desenvolvedores e usuários que operam recursos usando estas APIs no Chrome. Outros navegadores podem ter requisitos operacionais diferentes.

As APIs Language Detector e Translator funcionam no Chrome para computadores. Essas APIs não funcionam em dispositivos móveis.

As APIs Prompt, Summarizer, Writer, Rewriter e Proofreader funcionam no Chrome quando as seguintes condições são atendidas:

  • Sistema operacional: Windows 10 ou 11; macOS 13 ou mais recente (Ventura e versões mais recentes); Linux; ou ChromeOS (da plataforma 16389.0.0 e versões mais recentes) em Chromebook Plus dispositivos. O Google Chrome para Android, iOS e ChromeOS em dispositivos que não são Chromebook Plus ainda não é compatível com as APIs que usam o Gemini Nano.
  • Armazenamento: pelo menos 22 GB de espaço livre no volume que contém seu perfil do Chrome.
  • GPU ou CPU: os modelos integrados podem ser executados com GPU ou CPU.
    • GPU: mais de 4 GB de VRAM.
    • CPU: 16 GB de RAM ou mais e 4 núcleos de CPU ou mais.
    • Observação: a API Prompt com entrada de áudio requer uma GPU.
  • Rede: dados ilimitados ou uma conexão não limitada.

O tamanho exato do Gemini Nano pode variar à medida que o navegador atualiza o modelo. Para determinar o tamanho atual, acesse chrome://on-device-internals.

Comece a criar

várias APIs de IA integradas disponíveis em diferentes estágios de desenvolvimento. Algumas estão no Chrome Stable, outras estão disponíveis para participantes de testes de origem e outras estão disponíveis apenas para participantes do Programa de testes antecipados.

Cada API tem o próprio conjunto de instruções para começar e fazer o download do modelo, tanto para prototipagem local quanto em ambientes de produção com os testes de origem.

Todas essas APIs podem ser usadas ao criar extensões do Chrome.

Download do modelo

As APIs são integradas ao Chrome, assim como os modelos. Na primeira vez que um usuário interage com essas APIs, o modelo precisa ser baixado para o navegador.

Para determinar se uma API é utilizável e está pronta, chame a função assíncrona availability(), que retorna uma promessa com um dos seguintes valores:

  • "unavailable": o dispositivo do usuário ou as opções de sessão solicitadas não são compatíveis. O dispositivo pode ter energia ou espaço em disco insuficiente.
  • "downloadable": outros downloads são necessários para criar uma sessão, que pode incluir um modelo de especialista, um modelo de linguagem ou ajuste fino. A ativação do usuário pode ser necessária para chamar create().
  • "downloading": os downloads estão em andamento e precisam ser concluídos antes que você possa usar uma sessão.
  • "available": você pode criar uma sessão imediatamente.

Algumas APIs exigem outras opções ao chamar a disponibilidade. Por exemplo, a API Prompt exige a declaração de suporte a idiomas:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Ativação de usuário

Se o dispositivo oferecer suporte a APIs de IA integradas, mas o modelo ainda não tiver sido baixado, o usuário precisará interagir de forma significativa com a página para que o aplicativo inicie uma sessão com create().

Use the UserActivation.isActive propriedade para confirmar que um usuário interagiu diretamente com a página depois que ela terminou de carregar. Isso pode incluir um toque, clique, pressionamento de tecla, mousedown, ou outros eventos de ativação fixos.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Por exemplo, com a API Summarizer, você pode pedir aos usuários que interajam com um botão que diz "Resumir" para ativar Summarizer.create(), ou pode criar o resumo quando um usuário começar a digitar, um evento keydown.

Usar APIs no localhost

Todas as APIs estão disponíveis em localhost no Chrome.

  1. Acesse chrome://flags/#optimization-guide-on-device-model.
  2. Selecione Ativado.
  3. Clique em Reiniciar ou reinicie o Chrome.

Para APIs que usam o Gemini Nano, você também precisa definir chrome://flags/#prompt-api-for-gemini-nano como Ativado ou Ativado multilíngue. Você pode confirmar se o modelo foi baixado e funciona conforme esperado no console das Ferramentas para Desenvolvedores. Execute await LanguageModel.availability(); no console.

Resolver problemas do localhost

Se as flags não aparecerem em chrome://flags, verifique se você fez o download da versão mais recente do Chrome.

Se o modelo não funcionar como esperado, siga estas etapas:

  1. Reinicie o Google Chrome.
  2. Acesse chrome://on-device-internals.
  3. Selecione a guia Status do modelo e verifique se não há erros.
  4. Abra o DevTools e digite LanguageModel.availability(); no console. Isso vai retornar available.

Se necessário, aguarde um pouco e repita essas etapas.

Processo de padrões

Estamos trabalhando para padronizar essas APIs, para que elas funcionem em todos os navegadores. Isso significa que propusemos as APIs à comunidade de plataformas da Web e as movemos para o W3C Web Incubator Community Group para mais discussões.

Estamos solicitando feedback do W3C, Mozilla e WebKit para cada API.

Interaja e compartilhe feedback

Se você testar a IA integrada e tiver feedback, gostaríamos de recebê-lo.