Fecha de publicación: 14 de mayo de 2024. Última actualización: 20 de mayo de 2024
Estamos desarrollando APIs de la plataforma web y funciones del navegador diseñadas para funcionar con modelos de IA, modelos expertos y modelos de lenguaje grandes (LLM), integrados en el navegador. Con la IA integrada, tu sitio web o aplicación web puede realizar tareas potenciadas por IA sin necesidad de implementar, administrar ni alojar modelos por tu cuenta.
Descubre los beneficios de la IA integrada, nuestro plan de implementación y cómo puedes comenzar a implementar estas herramientas.
Si es la primera vez que usas la IA en la Web, lee nuestro glosario y conceptos de IA web.
Beneficios de la IA integrada para desarrolladores web
Con la IA integrada, tu navegador proporciona y administra modelos básicos y expertos.
La IA integrada ofrece los siguientes beneficios:
- Facilidad de implementación: El navegador distribuye los modelos, teniendo en cuenta la capacidad del dispositivo, y administra las actualizaciones. Esto significa que no eres responsable de descargar ni actualizar modelos grandes a través de una red. No tienes que resolver la expulsión del almacenamiento, el presupuesto de memoria del tiempo de ejecución, los costos de servicio y otros desafíos.
- Acceso a la aceleración de hardware: El tiempo de ejecución de IA del navegador está optimizado para aprovechar al máximo el hardware disponible, ya sea con GPU, NPU o CPU. En consecuencia, tu app puede obtener el mejor rendimiento en cada dispositivo.
Beneficios de la ejecución del cliente
Con la IA integrada, puedes realizar la IA del cliente, lo que significa que obtienes estos beneficios:
- Procesamiento local de datos sensibles: La IA del cliente puede mejorar tu historia de privacidad. Por ejemplo, si trabajas con datos sensibles, puedes ofrecer funciones de IA a los usuarios con encriptación de extremo a extremo.
- Experiencia del usuario rápida: En algunos casos, descartar el viaje de ida y vuelta al servidor significa que puedes ofrecer resultados casi instantáneos. La IA del cliente puede ser la diferencia entre una función viable y una experiencia del usuario no óptima.
- Mayor acceso a la IA: Los dispositivos de tus usuarios pueden asumir parte de la carga de procesamiento a cambio de un mayor acceso a las funciones. Por ejemplo, si ofreces funciones de IA premium, puedes obtener una vista previa de estas funciones con la IA del cliente para que los clientes potenciales puedan ver los beneficios de tu producto sin costo adicional. Este enfoque híbrido también puede ayudarte a administrar los costos de inferencia, en especial en los flujos de usuarios que se usan con frecuencia.
- Uso de IA sin conexión: Tus usuarios pueden acceder a las funciones de IA incluso cuando no hay conexión a Internet. Esto significa que tus sitios y apps web pueden funcionar como se espera sin conexión o con conectividad variable.
Hybrid AI: Cliente y servidor
Si bien la IA del cliente puede controlar una gran variedad de casos de uso, algunos requieren asistencia del servidor. La IA del servidor es una excelente opción para modelos grandes y puede admitir una gama más amplia de plataformas y dispositivos.
Puedes considerar un enfoque híbrido si tu aplicación requiere lo siguiente:
- Complejidad: Los casos de uso específicos y accesibles son más fáciles de admitir con la IA integrada en el dispositivo. Para casos de uso complejos, considera la implementación del servidor.
- Resistencia: Usa el servidor de forma predeterminada y usa el dispositivo cuando esté sin conexión o en una conexión inestable.
- Reserva correcta: La adopción de navegadores con IA integrada llevará tiempo, es posible que algunos modelos no estén disponibles y que los dispositivos más antiguos o menos potentes no cumplan los requisitos de hardware para ejecutar todos los modelos de manera óptima. Ofrece IA del servidor para esos usuarios.
Por ejemplo, si usas la API de Prompt integrada, la API solo está disponible en las extensiones de Chrome, en Windows, macOS y Linux. Para asegurarte de que todos tus usuarios puedan beneficiarse de tu función de IA, configura una arquitectura híbrida con Firebase AI Logic.
Accede a la IA integrada
Puedes acceder a las capacidades de IA integradas principalmente con las APIs de tareas, como la API de Translator o la API de Summarizer. Las APIs de tareas están diseñadas para ejecutar la inferencia en el mejor modelo para la asignación, ya sea un idioma o un modelo experto.
Cuándo usar la IA integrada
Estas son algunas formas en que la IA integrada puede beneficiarte a ti y a tus usuarios:
- Consumo de contenido mejorado con IA: Incluye resumen, traducción, categorización, caracterización y como proveedor de conocimiento.
- Creación de contenido compatible con IA: Como asistencia para la escritura, revisión, corrección gramatical y reformulación.
Varias de las APIs de IA integradas están disponibles en Chrome estable y en pruebas de origen. Las APIs exploratorias y las APIs en etapa inicial están disponibles para los participantes del Programa de vista previa anticipada (EPP).
Obtén una vista previa de las funciones nuevas
Necesitamos tu opinión para dar forma a las APIs que te ayudarán a cumplir con tus casos de uso y para informar nuestras conversaciones con otros proveedores de navegadores para la estandarización.
Únete al EPP para enviar comentarios sobre las ideas de IA integradas en etapa inicial y descubrir oportunidades para probar las APIs en curso a través de la creación de prototipos locales.
Esfuerzo de estandarización
Estamos trabajando para estandarizar todas estas APIs para la compatibilidad entre navegadores.
El Grupo de trabajo de WebML de W3C adoptó la API de Language Detector y la API de Translator. Les pedimos a Mozilla y WebKit sus posiciones sobre los estándares.
El Grupo de trabajo de WebML de W3C también adoptó la API de Summarizer, la API de Writer y la API de Rewriter. Les pedimos a Mozilla y WebKit sus posiciones sobre los estándares.