Publicado em 12 de dezembro de 2024, atualizado pela última vez em 20 de maio de 2025
Com APIs de IA integradas, seu aplicativo da Web pode realizar tarefas com tecnologia de IA sem precisar implantar ou gerenciar os próprios modelos de IA. Estamos trabalhando para padronizar essas APIs em todos os navegadores.
Requisitos
Para usar a IA integrada, há requisitos de modelo e hardware.
Modelos
As APIs Translator e Language Detector usam modelos de especialistas. Todas as outras APIs usam um modelo de linguagem projetado para ser executado localmente em computadores e laptops.
As APIs Summarizer, Writer, Rewriter e Proofreader só oferecem suporte à modalidade de texto para texto. A API Prompt tem recursos multimodais.
Gemini Nano no Chrome
O Chrome usa os modelos de linguagem do Gemini Nano. O Gemini Nano não está disponível em dispositivos móveis.
A partir do Chrome 140, o Gemini Nano oferece suporte a inglês, espanhol e japonês para texto de entrada e saída.
Antes de usar as APIs de IA integradas, reconheça a Política de uso proibido da IA generativa do Google.
Hardware
Os requisitos a seguir existem para desenvolvedores e usuários que operam recursos usando estas APIs no Chrome. Outros navegadores podem ter requisitos operacionais diferentes.
As APIs Language Detector e Translator funcionam no Chrome para computadores. Essas APIs não funcionam em dispositivos móveis.
As APIs Prompt, Summarizer, Writer, Rewriter e Proofreader funcionam no Chrome quando as seguintes condições são atendidas:
- Sistema operacional: Windows 10 ou 11; macOS 13 ou mais recente (Ventura e versões mais recentes); Linux; ou ChromeOS (da plataforma 16389.0.0 e versões mais recentes) em Chromebook Plus dispositivos. O Google Chrome para Android, iOS e ChromeOS em dispositivos que não são Chromebook Plus ainda não é compatível com as APIs que usam o Gemini Nano.
- Armazenamento: pelo menos 22 GB de espaço livre no volume que contém seu perfil do Chrome.
- GPU ou CPU: os modelos integrados podem ser executados com GPU ou CPU.
- GPU: mais de 4 GB de VRAM.
- CPU: 16 GB de RAM ou mais e 4 núcleos de CPU ou mais.
- Observação: a API Prompt com entrada de áudio requer uma GPU.
- Rede: dados ilimitados ou uma conexão não limitada.
O tamanho exato do Gemini Nano pode variar à medida que o navegador atualiza o modelo. Para determinar o tamanho atual, acesse chrome://on-device-internals.
Comece a criar
Há várias APIs de IA integradas disponíveis em diferentes estágios de desenvolvimento. Algumas estão no Chrome Stable, outras estão disponíveis para participantes de testes de origem e outras estão disponíveis apenas para participantes do Programa de testes antecipados.
Cada API tem o próprio conjunto de instruções para começar e fazer o download do modelo, tanto para prototipagem local quanto em ambientes de produção com os testes de origem.
- API Translator
- API Language Detector
- API Summarizer
- API Writer e API Rewriter
- API Proofreader
- API Prompt
Todas essas APIs podem ser usadas ao criar extensões do Chrome.
Download do modelo
As APIs são integradas ao Chrome, assim como os modelos. Na primeira vez que um usuário interage com essas APIs, o modelo precisa ser baixado para o navegador.
Para determinar se uma API é utilizável e está pronta, chame a função assíncrona availability(), que retorna uma promessa com um dos seguintes valores:
"unavailable": o dispositivo do usuário ou as opções de sessão solicitadas não são compatíveis. O dispositivo pode ter energia ou espaço em disco insuficiente."downloadable": outros downloads são necessários para criar uma sessão, que pode incluir um modelo de especialista, um modelo de linguagem ou ajuste fino. A ativação do usuário pode ser necessária para chamarcreate()."downloading": os downloads estão em andamento e precisam ser concluídos antes que você possa usar uma sessão."available": você pode criar uma sessão imediatamente.
Algumas APIs exigem outras opções ao chamar a disponibilidade. Por exemplo, a API Prompt exige a declaração de suporte a idiomas:
// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });
Ativação de usuário
Se o dispositivo oferecer suporte a APIs de IA integradas, mas o modelo ainda não tiver sido baixado, o usuário precisará interagir de forma significativa com a página para que o aplicativo inicie uma sessão com create().
Use the UserActivation.isActive
propriedade para confirmar que um usuário interagiu diretamente com a página depois que ela
terminou de carregar. Isso pode incluir um toque, clique, pressionamento de tecla, mousedown, ou
outros eventos de ativação fixos.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
Por exemplo, com a API Summarizer, você pode
pedir aos usuários que interajam com um botão que diz "Resumir" para ativar
Summarizer.create(), ou pode criar o resumo quando um usuário começar a
digitar, um evento keydown.
Usar APIs no localhost
Todas as APIs estão disponíveis em localhost no Chrome.
- Acesse
chrome://flags/#optimization-guide-on-device-model. - Selecione Ativado.
- Clique em Reiniciar ou reinicie o Chrome.
Para APIs que usam o Gemini Nano, você também precisa definir chrome://flags/#prompt-api-for-gemini-nano como Ativado ou Ativado multilíngue. Você pode confirmar se o modelo foi baixado e funciona
conforme esperado no console das Ferramentas para Desenvolvedores.
Execute await LanguageModel.availability(); no console.
Resolver problemas do localhost
Se as flags não aparecerem em chrome://flags, verifique se você fez o download
da versão mais recente do Chrome.
Se o modelo não funcionar como esperado, siga estas etapas:
- Reinicie o Google Chrome.
- Acesse
chrome://on-device-internals. - Selecione a guia Status do modelo e verifique se não há erros.
- Abra o DevTools e digite
LanguageModel.availability();no console. Isso vai retornaravailable.
Se necessário, aguarde um pouco e repita essas etapas.
Processo de padrões
Estamos trabalhando para padronizar essas APIs, para que elas funcionem em todos os navegadores. Isso significa que propusemos as APIs à comunidade de plataformas da Web e as movemos para o W3C Web Incubator Community Group para mais discussões.
Estamos solicitando feedback do W3C, Mozilla e WebKit para cada API.
Interaja e compartilhe feedback
Se você testar a IA integrada e tiver feedback, gostaríamos de recebê-lo.
- Descubra todas as APIs de IA integradas.
- Participe do programa de testes antecipados para conferir as novas APIs e acessar nossa lista de e-mails.
- Se você tiver feedback sobre a implementação do Chrome, registre um bug do Chromium.
- Saiba mais sobre os padrões da Web.