Assista nossas palestras sobre IA no I/O 2025

Alexandra Klepper
Alexandra Klepper

Publicado em: 22 de maio de 2025

A IA está transformando a maneira como os desenvolvedores da Web criam sites e aplicativos da Web. No Google I/O 2025, compartilhamos o que fizemos no ano passado, mostramos como nossos parceiros estão usando a IA na Web e anunciamos novas APIs de IA integradas.

Perdeu o evento? Temos uma ótima notícia: agora você pode assistir às palestras on demand.

IA prática integrada com o Gemini Nano no Chrome

Nossa principal missão é tornar o Chrome e a Web mais inteligentes para todos os desenvolvedores e usuários. Nesta palestra, Thomas Steiner compartilha atualizações sobre a IA integrada, casos de uso práticos e uma visão do nosso futuro.

A IA integrada executa modelos do lado do cliente no navegador, o que tem várias vantagens:

  • Privado: os dados sensíveis do usuário permanecem no dispositivo e nunca precisam sair do navegador.
  • Off-line: os aplicativos podem acessar recursos de IA, mesmo sem uma conexão de Internet.
  • Eficientes: graças à aceleração de hardware, essas APIs oferecem excelente desempenho.

Confira exemplos de código para cada uma das APIs de IA integradas, receba uma atualização sobre o status delas e veja quais empresas estão implementando essa tecnologia.

APIs multimodais

Estamos trabalhando em APIs multimodais totalmente novas. Isso significa que você pode perguntar ao Gemini Nano sobre o que ele "vê" em conteúdo visual ou "ouve" em conteúdo de áudio. Por exemplo, receba sugestões de texto alternativo para imagens enviadas em uma plataforma de blog, que os usuários podem refinar e ajustar. Ou você pode pedir para o Gemini Nano escrever descrições ou transcrições de podcasts.

IA híbrida

Um desafio que os desenvolvedores enfrentam com a IA do lado do cliente é que nem todas as plataformas e navegadores atendem aos requisitos de hardware para executar um modelo no dispositivo. O Gemini e o Firebase se uniram para criar o SDK Web do Firebase para que, quando as implementações do lado do cliente não estiverem disponíveis, você possa usar o Gemini Nano em um servidor.

Trabalhando com você

Estamos muito felizes por ter trabalhado com tantos desenvolvedores em APIs de IA integrada. Nossos esforços não seriam possíveis sem você.

  • Programa de prévia antecipada: mais de 16.000 desenvolvedores participaram do EPP, testando novas APIs, descobrindo novos casos de uso e enviando feedback para criar uma IA melhor para a Web.
  • Hackathons: já realizamos dois hackathons, e você criou sites e extensões incríveis.

Seu trabalho não acabou. Continue compartilhando seu feedback e testando as novas APIs integradas. Vamos continuar iterando. Você pode até ajudar a padronizar essas APIs participando do Grupo da comunidade de aprendizado de máquina na Web do W3C.

O futuro das extensões do Chrome com o Gemini no seu navegador

O número de extensões com tecnologia de IA dobrou nos últimos dois anos. Na verdade, 10% de todas as extensões instaladas na Chrome Web Store usam IA. Nesta palestra, Sebastian Benz dá exemplos práticos de por que as extensões do Chrome e o Gemini são uma combinação tão poderosa.

Por exemplo, como extrair e processar dados de sites no cliente usando a API de solicitação recém-lançada do Chrome para tornar o navegador mais útil.

Demonstrar o potencial dos novos recursos multimodais da API de solicitação do Chrome em extensões do Chrome para tornar áudio e imagens mais acessíveis aos usuários.

Para conferir o futuro da navegação, explicando como o Projeto Mariner do Google DeepMind usa extensões do Chrome e as mais recentes APIs Gemini Cloud para criar um agente de navegador completo.

Descubra o potencial de usar o Gemini na nuvem ou no navegador nas Extensões do Chrome para criar novas experiências de navegação e tornar o navegador mais útil.

Casos de uso e estratégias de IA na Web no mundo real

Yuriko Hirota
Yuriko Hirota
Swetha Gopalakrishnan
Swetha Gopalakrishnan

Yuriko Hirota e Swetha Gopalakrishnan destacaram exemplos reais de empresas que usam a IA na Web para melhorar os negócios e a experiência do usuário.Seja uma solução que usa modelos do lado do cliente, do lado do servidor ou híbrida, o que importa são as novas funções e recursos interessantes que você disponibiliza aos usuários agora mesmo.

A BILIBILI tornou as transmissões de vídeo mais interessantes com um novo recurso: comentários em tela de bala. Eles oferecem comentários de usuários em tempo real no vídeo, renderizados atrás do alto-falante. Para isso, eles usam a segmentação de imagens, um conceito bem conhecido de aprendizado de máquina. Como resultado, a duração da sessão aumentou em 30%. A Tokopedia reduziu o atrito no processo de verificação de vendedores usando um modelo de detecção de rosto para avaliar a qualidade das fotos enviadas. Como resultado, eles reduziram as aprovações manuais em quase 70%.

O Vision Nanny, uma plataforma da Web para crianças com deficiência visual cerebral (CVI), oferece atividades de estimulação visual com tecnologia de IA. Eles usam várias bibliotecas do MediaPipe, incluindo o modelo de detecção de pontos de referência das mãos, que localiza pontos principais das mãos em uma imagem, vídeo ou em tempo real. Um piloto com 50 crianças demonstrou que a Vision Nanny ofereceu respostas cinco vezes mais rápido do que as atividades manuais de estimulação visual. Os terapeutas relataram uma economia média de três horas por sessão ao remover a configuração manual.

O Google Meet tem vários recursos ativados por IA, desde a melhoria da iluminação até a redução de vídeos borrados e desfocados. O maior desafio é que esses recursos precisam funcionar em tempo real. É aí que entra o WebAssembly (Wasm), que aproveita toda a capacidade da CPU de um computador e permite o processamento de vídeo em tempo real.

Esses são apenas alguns exemplos reais de IA na Web. Várias outras empresas testaram as APIs de IA integradas, e algumas delas compartilharam o trabalho em estudos de caso.

Agentes de IA da Web do lado do cliente para criar experiências do usuário mais inteligentes no futuro

Jason Mayes falou sobre o futuro da Internet: agentes de IA da Web. A Web tem um futuro de agentes, trazendo recursos de IA diretamente para o navegador, para realizar trabalhos úteis em seu nome, além das capacidades dos modelos de linguagem grandes (LLMs).

Com uma abordagem do lado do cliente, há privacidade aprimorada, latência reduzida e possíveis economias de custo significativas. Com os agentes, é possível fazer upgrade do seu site atual, realizar tarefas de forma autônoma para um usuário, selecionar e usar ferramentas expostas dinamicamente (possivelmente em um loop), permitindo que o agente conclua tarefas potencialmente complexas ou de várias etapas.

Os agentes podem:

  • Planejar e dividir subtarefas, lidando com problemas mais complexos por meio de planejamento de várias etapas para dividir a tarefa em etapas lógicas para conclusão.
  • Selecione as melhores ferramentas, sejam elas funções, uso de API ou acesso ao repositório de dados para o conhecimento básico do modelo de linguagem aumentado, e realize ações no mundo externo.
  • Reter a memória baseada no contexto, com base em saídas anteriores do agente ou ferramentas externas. A memória de curto prazo funciona como um buffer FIFO de histórico de contexto até o tamanho da janela de contexto do modelo, em comparação com a memória de longo prazo, em que um banco de dados vetorial pode ser usado para armazenar informações e recuperar conforme necessário de sessões de conversa anteriores ou outras fontes de dados.

Os agentes de IA da Web foram projetados para se integrar às tecnologias da Web atuais em JavaScript. Por fim, é importante continuar acelerando nosso hardware para executar melhor os modelos no navegador. No futuro, tecnologias como a WebNN vão desempenhar um papel fundamental na otimização da execução de modelos em CPUs, GPUs e NPUs. Com a tendência de LLMs menores e o avanço contínuo, essa tecnologia só vai se tornar mais poderosa no futuro.

Use uma abordagem híbrida, combinando o processamento no dispositivo com chamadas estratégicas na nuvem, para criar experiências de usuário inteligentes, responsivas e personalizadas no navegador agora mesmo. Em breve, o retorno do investimento na abordagem de IA da Web vai compensar à medida que os dispositivos se tornarem mais capazes de executar LLMs.

Fique por dentro do Google I/O 2025

Já lançamos todas as palestras do Google I/O 2025, com uma playlist dedicada a desenvolvedores da Web. Confira ainda mais em io.google/2025.