Publicado el 12 de diciembre de 2024. Última actualización el 20 de mayo de 2025
Con las APIs de IA integradas, tu aplicación web puede realizar tareas potenciadas por IA sin necesidad de implementar ni administrar sus propios modelos de IA. Estamos trabajando para estandarizar estas APIs en todos los navegadores.
Requisitos
Para usar la IA integrada, existen requisitos de modelo y hardware.
Modelos
Las APIs de Translator y Language Detector usan modelos expertos. Todas las demás APIs usan un modelo de lenguaje diseñado para ejecutarse de forma local en computadoras de escritorio y laptops.
Las APIs de Summarizer, Writer, Rewriter y Proofreader solo admiten la modalidad de texto a texto. La API de Prompt tiene capacidades multimodales.
Gemini Nano en Chrome
Chrome usa los modelos de lenguaje de Gemini Nano. Gemini Nano no está disponible en dispositivos móviles.
A partir de Chrome 140, Gemini Nano admite inglés, español y japonés para el texto de entrada y salida.
Antes de usar las APIs de IA integradas, reconoce la Política de Uso Prohibido de IA Generativas de Google.
Hardware
Existen los siguientes requisitos para los desarrolladores y los usuarios que operan funciones con estas APIs en Chrome. Es posible que otros navegadores tengan requisitos operativos diferentes.
Las APIs de Language Detector y Translator funcionan en Chrome en computadoras de escritorio. Estas APIs no funcionan en dispositivos móviles.
Las APIs de Prompt, Summarizer, Writer, Rewriter y Proofreader funcionan en Chrome cuando se cumplen las siguientes condiciones:
- Sistema operativo: Windows 10 o 11; macOS 13 o versiones posteriores (Ventura y versiones posteriores); Linux; o ChromeOS (desde la plataforma 16389.0.0 y versiones posteriores) en Chromebook Plus dispositivos. Las APIs que usan Gemini Nano aún no admiten Chrome para Android, iOS y ChromeOS en dispositivos que no sean Chromebook Plus.
- Almacenamiento: Al menos 22 GB de espacio libre en el volumen que contiene tu perfil de Chrome.
- GPU o CPU: Los modelos integrados se pueden ejecutar con GPU o CPU.
- GPU: Estrictamente más de 4 GB de VRAM.
- CPU: 16 GB de RAM o más y 4 núcleos de CPU o más.
- Nota: La API de Prompt con entrada de audio requiere una GPU.
- Red: Datos ilimitados o una conexión sin uso medido.
El tamaño exacto de Gemini Nano puede variar a medida que el navegador actualiza el modelo. Para determinar el tamaño actual, visita chrome://on-device-internals.
Comienza con la compilación
Existen varias APIs de IA integradas disponibles en diferentes etapas de desarrollo. Algunas están en la versión estable de Chrome, otras están disponibles para los participantes de las pruebas de origen, y otras solo están disponibles para los participantes del Programa de vista previa anticipada.
Cada API tiene su propio conjunto de instrucciones para comenzar y descargar el modelo, tanto para la creación de prototipos locales como en entornos de producción con las pruebas de origen.
- API de Translator
- API de Language Detector
- API de Summarizer
- API de Writer y API de Rewriter
- API de Proofreader
- API de Prompt
Todas estas APIs se pueden usar cuando se compilan extensiones de Chrome.
Descarga de modelos
Las APIs están integradas en Chrome, al igual que los modelos. La primera vez que un usuario interactúa con estas APIs, el modelo debe descargarse en el navegador.
Para determinar si una API es utilizable y está lista, llama a la función asíncrona availability(), que muestra una promesa con uno de los siguientes valores:
"unavailable": No se admiten el dispositivo del usuario ni las opciones de sesión solicitadas. Es posible que el dispositivo no tenga suficiente energía o espacio en el disco."downloadable": Se necesitan descargas adicionales para crear una sesión, que puede incluir un modelo experto, un modelo de lenguaje o un ajuste. Es posible que se requiera la activación del usuario para llamar acreate()."downloading": Las descargas están en curso y deben completarse antes de que puedas usar una sesión."available": Puedes crear una sesión de inmediato.
Algunas APIs requieren opciones adicionales cuando se llama a la disponibilidad. Por ejemplo, la API de Prompt requiere declarar la compatibilidad con el idioma:
// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });
Activación del usuario
Si el dispositivo puede admitir APIs de IA integradas, pero el modelo aún no se descargó, el usuario debe interactuar de manera significativa con tu página para que tu aplicación inicie una sesión con create().
Usa la UserActivation.isActive
propiedad para confirmar que un usuario interactuó directamente con la página desde que la página
terminó de cargarse. Esto puede incluir una presión, un clic, una presión de tecla, mousedown, o
otros eventos de activación persistentes.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
Por ejemplo, con la API de Summarizer, puedes
pedirles a los usuarios que interactúen con un botón que diga "Resumir" para activar
Summarizer.create(), o puedes crear el resumidor una vez que un usuario comience a
escribir, un evento keydown.
Usa APIs en localhost
Todas las APIs están disponibles en localhost en Chrome.
- Ve a
chrome://flags/#optimization-guide-on-device-model. - Selecciona Habilitado.
- Haz clic en Volver a iniciar o reinicia Chrome.
Para las APIs que usan Gemini Nano, también debes configurar chrome://flags/#prompt-api-for-gemini-nano como Habilitado o Habilitado en varios idiomas. Puedes confirmar que el modelo se descargó y funciona
según lo previsto en la consola de Herramientas para desarrolladores.
Ejecuta await LanguageModel.availability(); en la consola.
Soluciona problemas de localhost
Si las marcas no aparecen en chrome://flags, asegúrate de haber descargado
la versión más reciente de Chrome.
Si el modelo no funciona como se espera, sigue estos pasos:
- Reinicia Chrome.
- Ve a
chrome://on-device-internals. - Selecciona la pestaña Estado del modelo y asegúrate de que no haya errores.
- Abre Herramientas para desarrolladores y escribe
LanguageModel.availability();en la consola. Debería mostraravailable.
Si es necesario, espera un tiempo y repite estos pasos.
Proceso de estándares
Estamos trabajando para estandarizar estas APIs, de modo que funcionen en todos los navegadores. Esto significa que propusimos las APIs a la comunidad de plataformas web y las trasladamos al Grupo de la comunidad de incubadora web de W3C para que se debatan más.
Solicitamos comentarios de W3C, Mozilla y WebKit para cada API.
Participa y comparte comentarios
Si pruebas la IA integrada y tienes comentarios, nos encantaría conocerlos.
- Descubre todas las APIs de IA integradas.
- Únete al Programa de vista previa anticipada para obtener una vista previa de las APIs nuevas y acceder a nuestra lista de distribución.
- Si tienes comentarios sobre la implementación de Chrome, informa un error de Chromium.
- Obtén información sobre los estándares web.