Assista nossas palestras sobre IA no I/O 2025

Alexandra Klepper
Alexandra Klepper

Publicado em: 22 de maio de 2025

A IA está transformando a maneira como os desenvolvedores da Web criam sites e aplicativos da Web. No Google I/O 2025, compartilhamos o que fizemos no último ano, demonstramos como nossos parceiros estão usando a IA na Web, e anunciamos novas APIs de IA integradas.

Você perdeu o evento? Boas notícias: agora você pode assistir às palestras on demand.

IA integrada prática com o Gemini Nano no Chrome

Nossa principal missão é tornar o Chrome e a Web mais inteligentes para todos os desenvolvedores e usuários. Nesta palestra, Thomas Steiner compartilha atualizações sobre a IA integrada, casos de uso práticos e uma visão do nosso futuro.

A IA integrada executa modelos do lado do cliente no navegador, o que tem várias vantagens:

  • Privado: os dados confidenciais do usuário permanecem no dispositivo, sem precisar sair do navegador.
  • Off-line: os aplicativos podem acessar recursos de IA, mesmo sem uma conexão de Internet.
  • Com bom desempenho: graças à aceleração de hardware, essas APIs oferecem excelente desempenho.

Confira exemplos de código para cada uma das APIs de IA integradas, receba uma atualização sobre o status delas e veja quais empresas estão implementando essa tecnologia.

APIs multimodais

Estamos trabalhando em novas APIs multimodais. Isso significa que você pode perguntar ao modelo sobre o que ele "vê" no conteúdo visual ou "ouve" no conteúdo de áudio. Por exemplo, receba sugestões de texto alternativo em imagens enviadas em uma plataforma de blog, que os usuários podem refinar e ajustar. Ou você pode pedir ao Gemini Nano para escrever descrições ou transcrições de podcasts.

IA híbrida

Um desafio que os desenvolvedores enfrentam com a IA do lado do cliente é que nem todas as plataformas e navegadores atendem aos requisitos de hardware para executar um modelo no dispositivo. O Gemini e o Firebase fizeram uma parceria para criar o SDK da Web do Firebase . Assim, quando as implementações do lado do cliente não estiverem disponíveis, você poderá usar o Gemini Nano em um servidor.

Trabalhando com você

Estamos muito felizes por ter trabalhado com tantos desenvolvedores em APIs de IA integradas. Nossos esforços não seriam possíveis sem você.

  • Programa de prévia antecipada: mais de 16.000 desenvolvedores aderiram ao EPP, testando novas APIs, descobrindo novos casos de uso e enviando feedback para criar uma IA melhor para a Web.
  • Hackathons: já realizamos dois hackathons, e você criou sites e extensões incríveis.

Seu trabalho não acabou. Continue compartilhando seu feedback e testando as novas APIs integradas. Vamos continuar iterando. Você pode até ajudar a padronizar essas APIs participando do Grupo da comunidade de aprendizado de máquina da Web do W3C.

O futuro das extensões do Chrome com o Gemini no navegador

O número de extensões com tecnologia de IA dobrou nos últimos dois anos. Na verdade, 10% de todas as extensões instaladas na Chrome Web Store usam IA. Nesta palestra, Sebastian Benz oferece exemplos práticos de por que as extensões do Chrome e o Gemini são uma combinação tão poderosa.

Os exemplos variam de como você pode tornar o navegador mais útil extraindo e processando dados de sites no cliente usando a API de comandos recém-lançada do Chrome.

Até a demonstração do potencial de novos recursos multimodais da API de comandos do Chrome nas extensões do Chrome para tornar áudio e imagens mais acessíveis aos usuários.

Para conferir o futuro da navegação, explicando como o Projeto Mariner do Google DeepMind usa extensões do Chrome e as APIs mais recentes do Gemini Cloud para criar um agente de navegador completo.

Explore o potencial de usar o Gemini na nuvem ou no navegador em extensões do Chrome para criar novas experiências de navegação e tornar o navegador mais útil.

Casos de uso e estratégias de IA da Web no mundo real

Yuriko Hirota
Yuriko Hirota
Swetha Gopalakrishnan
Swetha Gopalakrishnan

Yuriko Hirota e Swetha Gopalakrishnan destacaram exemplos reais de empresas que usam IA na Web para melhorar os negócios e a experiência do usuário.Se a solução usa modelos do lado do cliente, do servidor ou uma solução híbrida, o que importa são as novas funções e recursos interessantes que você disponibiliza aos usuários agora.

A BILIBILI tornou os streams de vídeo mais envolventes com um novo recurso: comentários de tela de bala. Eles oferecem comentários de usuários em tempo real no vídeo, renderizados atrás do palestrante. Para isso, eles usam a segmentação de imagens, um conceito de aprendizado de máquina bem compreendido. Como resultado, a duração da sessão aumentou em 30%. A Tokopedia reduziu o atrito no processo de verificação do vendedor usando um modelo de detecção facial para avaliar a qualidade das fotos enviadas. Como resultado, eles reduziram as aprovações manuais em quase 70%.

A Vision Nanny, uma plataforma da Web para crianças com deficiência visual cerebral (CVI, na sigla em inglês), oferece atividades de estimulação visual com tecnologia de IA. Eles usam várias bibliotecas do MediaPipe, incluindo o modelo de detecção de pontos de referência da mão, que localiza pontos importantes das mãos em uma imagem, vídeo ou em tempo real. Um projeto piloto com 50 crianças demonstrou que a Vision Nanny ofereceu respostas 5 vezes mais rápidas do que as atividades manuais de estimulação visual. Os terapeutas relataram uma economia média de três horas por sessão ao remover a configuração manual.

O Google Meet tem vários recursos ativados por IA, desde a melhoria da iluminação até a redução de vídeos borrados e desfocados. O maior desafio é que esses recursos precisam funcionar em tempo real. É aí que o WebAssembly (Wasm) entra em cena, para aproveitar todo o poder da CPU de um computador e permitir o processamento de vídeo em tempo real.

Estes são apenas alguns exemplos reais de IA na Web. Várias outras empresas fizeram experimentos com as APIs de IA integradas, e algumas delas compartilharam o trabalho em estudos de caso.

Agentes de IA da Web do lado do cliente para criar experiências de usuário futuras mais inteligentes

Jason Mayes explicou o futuro da Internet: agentes de IA da Web. A Web tem um futuro agêntico, trazendo recursos de IA diretamente para o navegador, para realizar trabalhos úteis em seu nome, além dos recursos de modelos de linguagem grandes (LLMs).

Com uma abordagem do lado do cliente, há maior privacidade, latência reduzida e possível economia de custos significativa. Os agentes permitem fazer upgrade do seu site atual para realizar tarefas de forma autônoma para um usuário, selecionando e usando ferramentas expostas dinamicamente, possivelmente em um loop, permitindo que o agente conclua tarefas potencialmente complexas ou com várias etapas.

Os agentes podem:

  • Planejar e dividir subtarefas, processando problemas mais complexos por meio de um planejamento de várias etapas para dividir a tarefa em etapas lógicas a serem concluídas.
  • Selecionar as melhores ferramentas, sejam funções, uso de API ou acesso ao armazenamento de dados para o conhecimento básico do modelo de linguagem aumentado, e realizar ações no mundo externo.
  • Manter a memória baseada no contexto, com base em saídas anteriores do agente ou ferramentas externas. A memória de curto prazo funciona como um buffer FIFO do histórico de contexto até o tamanho da janela de contexto do modelo, em comparação com a memória de longo prazo, em que um banco de dados vetorial pode ser usado para armazenar informações a serem recuperadas conforme necessário em sessões de conversa anteriores ou outras fontes de dados.

Os agentes de IA da Web são projetados para serem integrados às tecnologias da Web atuais em JavaScript. Por fim, é importante que continuemos acelerando nosso hardware para executar modelos da melhor maneira possível no navegador. Olhando para o futuro, tecnologias como o WebNN vão desempenhar um papel fundamental na otimização da execução de modelos em CPUs, GPUs e NPUs. Com a tendência de LLMs menores e o avanço contínuo, isso só vai se tornar mais poderoso no futuro.

Considere usar uma abordagem híbrida, combinando o processamento no dispositivo com chamadas estratégicas na nuvem, para criar experiências de usuário inteligentes, responsivas e personalizadas no navegador agora. Em breve, seu retorno do investimento na abordagem de IA da Web será recompensado à medida que os dispositivos se tornarem mais capazes de executar LLMs.

Fique por dentro do Google I/O 2025

Lançamos todas as palestras do Google I/O 2025, com uma playlist dedicada a desenvolvedores da Web. Assista ainda mais em io.google/2025.