Mira nuestras charlas sobre IA en I/O 2025

Alexandra Klepper
Alexandra Klepper

Publicado el 22 de mayo de 2025

La IA está transformando la forma en que los desarrolladores web crean sitios y aplicaciones web. En Google I/O 2025, compartimos en qué trabajamos durante el último año, mostramos cómo nuestros socios utilizan la IA en la Web y anunciamos nuevas APIs de IA integradas.

¿Te perdiste el evento? ¡Tenemos buenas noticias! Ahora puedes mirar las charlas on demand.

IA integrada práctica con Gemini Nano en Chrome

Nuestra misión principal es hacer que Chrome y la Web sean más inteligentes para todos los desarrolladores y usuarios. En esta charla, Thomas Steiner comparte actualizaciones sobre la IA integrada, casos de uso prácticos y un vistazo a nuestro futuro.

La IA integrada ejecuta modelos del cliente en el navegador, lo que tiene varias ventajas:

  • Privado: Los datos sensibles del usuario permanecen en el dispositivo y nunca deben salir del navegador.
  • Sin conexión: Las aplicaciones pueden acceder a las capacidades de IA, incluso sin conexión a Internet.
  • Rendimiento: Gracias a la aceleración por hardware, estas APIs ofrecen un rendimiento excelente.

Consulta muestras de código para cada una de las APIs integradas basadas en IA, obtén actualizaciones sobre su estado y descubre qué empresas están implementando esta tecnología.

APIs multimodales

Estamos trabajando en APIs multimodales completamente nuevas. Esto significa que puedes preguntarle a Gemini Nano sobre lo que "ve" en el contenido visual o "escucha" en el contenido de audio. Por ejemplo, obtener sugerencias de texto alternativo para las imágenes subidas en una plataforma de blogs, que los usuarios pueden definir y ajustar. También podrías pedirle a Gemini Nano que escriba descripciones o transcripciones para podcasts.

Hybrid AI

Uno de los desafíos que enfrentan los desarrolladores con la IA del cliente es que no todas las plataformas y navegadores cumplen con los requisitos de hardware para ejecutar un modelo en el dispositivo. Gemini y Firebase se asociaron para crear el SDK web de Firebase, de modo que, cuando las implementaciones del cliente no estén disponibles, puedas recurrir a Gemini Nano en un servidor.

Trabajamos contigo

Nos complace haber trabajado con tantos desarrolladores en las APIs de IA integradas. Nuestros esfuerzos no serían posibles sin ti.

  • Programa de versión preliminar anticipada: Más de 16,000 desarrolladores se unieron al EPP, probaron nuevas APIs, descubrieron nuevos casos de uso y proporcionaron comentarios para crear una mejor IA para la Web.
  • Hackathons: Organizamos dos hackathons y creaste sitios web y extensiones increíbles.

Tu trabajo no terminó. Sigue compartiendo tus comentarios y probando las nuevas APIs integradas, y nosotros seguiremos realizando iteraciones. Incluso puedes ayudar a estandarizar estas APIs uniéndote al Web Machine Learning Community Group del W3C.

El futuro de las extensiones de Chrome con Gemini en tu navegador

La cantidad de extensiones potenciadas por IA se duplicó en los últimos dos años. De hecho, el 10% de todas las extensiones instaladas desde Chrome Web Store usan IA. En esta charla, Sebastian Benz brinda ejemplos prácticos de por qué las extensiones de Chrome y Gemini son una combinación tan potente.

Los ejemplos abarcan desde cómo puedes hacer que el navegador sea más útil extrayendo y procesando datos de sitios web en el cliente con la API de mensajes recién lanzada de Chrome.

Demostrar el potencial de las nuevas capacidades multimodales de la API de mensajes de Chrome en las extensiones de Chrome para que los usuarios puedan acceder más fácilmente a imágenes y audio

Para echar un vistazo al futuro de la navegación, explicamos cómo el Proyecto Mariner de Google DeepMind usa las extensiones de Chrome y las APIs de Gemini Cloud más recientes para crear un agente de navegador completo.

Explora el potencial de usar Gemini en la nube o en el navegador en las extensiones de Chrome para crear nuevas experiencias de navegación y hacer que el navegador sea más útil.

Casos de uso y estrategias de la IA web en el mundo real

Yuriko Hirota
Yuriko Hirota
Swetha Gopalakrishnan
Swetha Gopalakrishnan

Yuriko Hirota y Swetha Gopalakrishnan destacaron ejemplos reales de empresas que usan la IA en la Web para mejorar su negocio y la experiencia del usuario.Ya sea que su solución use modelos del cliente, del servidor o una solución híbrida, lo que importa son las nuevas y emocionantes funciones que pones a disposición de tus usuarios ahora mismo.

BILIBILI hizo que sus transmisiones de video fueran más atractivas con una nueva función: los comentarios de pantalla de balas. Ofrecen comentarios de los usuarios en tiempo real en el video, que se renderizan detrás del orador. Para ello, usan la segmentación de imágenes, un concepto de aprendizaje automático bien conocido. Como resultado, la duración de la sesión aumentó un 30%. Tokopedia redujo la fricción en su proceso de verificación de vendedores con un modelo de detección de rostros para evaluar la calidad de las fotos subidas. Como resultado, redujeron las aprobaciones manuales en casi un 70%.

Vision Nanny, una plataforma web para niños con discapacidad visual cerebral (CVI), proporciona actividades de estimulación visual potenciadas por IA. Usan varias bibliotecas de MediaPipe, incluido el modelo de detección de puntos de referencia de la mano, que ubica los puntos clave de las manos en una imagen, un video o en tiempo real. Un piloto con 50 niños demostró que Vision Nanny brindó respuestas 5 veces más rápido que las actividades de estimulación visual manual. Los terapeutas informaron que ahorraron un promedio de tres horas por sesión gracias a la eliminación de la configuración manual.

Google Meet tiene varias funciones habilitadas por IA, desde mejorar la iluminación hasta reducir el desenfoque y los videos borrosos. El mayor desafío es que estas funciones deben funcionar en tiempo real. Ahí es donde entra en juego WebAssembly (Wasm), para aprovechar toda la potencia de la CPU de una computadora y permitir el procesamiento de video en tiempo real.

Estos son solo algunos ejemplos del uso de la IA en la Web. Varias empresas más experimentaron con las APIs de IA integradas, y algunas de ellas compartieron su trabajo en casos de éxito.

Agentes de IA web del cliente para crear experiencias del usuario más inteligentes en el futuro

Jason Mayes explicó el futuro de Internet: los agentes web basados en IA. La Web tiene un futuro agentivo, ya que incorpora capacidades de IA directamente en el navegador para realizar tareas útiles en tu nombre, más allá de las capacidades de los modelos de lenguaje grandes (LLM).

Con un enfoque del lado del cliente, se mejora la privacidad, se reduce la latencia y se pueden obtener ahorros significativos en los costos. Los agentes te permiten actualizar tu sitio web existente para realizar tareas de forma autónoma para un usuario, seleccionando y usando de forma dinámica las herramientas expuestas, posiblemente en un bucle, lo que permite que el agente complete tareas potencialmente complejas o de varios pasos.

Los agentes pueden hacer lo siguiente:

  • Planificar y dividir subtareas, y abordar problemas más complejos a través de la planificación de varios pasos para desglosar la tarea en pasos lógicos para completarla
  • Selecciona las mejores herramientas, ya sean funciones, uso de APIs o acceso al almacén de datos para el conocimiento base del modelo de lenguaje aumentado, y, luego, realiza acciones en el mundo exterior.
  • Retener la memoria basada en el contexto, según los resultados anteriores del agente o las herramientas externas La memoria a corto plazo actúa como un búfer FIFO del historial de contexto hasta el tamaño de la ventana de contexto del modelo, a diferencia de la memoria a largo plazo, en la que se puede usar una base de datos vectorial para almacenar información que se pueda recuperar según sea necesario de sesiones de conversación anteriores o de otras fuentes de datos por completo.

Los agentes de IA web están diseñados para integrarse en las tecnologías web existentes en JavaScript. En última instancia, es importante que sigamos acelerando nuestro hardware para ejecutar mejor los modelos en el navegador. De cara al futuro, la tecnología como WebNN desempeñará un papel clave en la optimización de la ejecución de modelos en CPUs, GPUs y NPUs. Con la tendencia hacia los LLMs más pequeños y el avance continuo, esta capacidad solo aumentará su potencia en el futuro.

Considera usar un enfoque híbrido que combine el procesamiento en el dispositivo con llamadas estratégicas a la nube para crear experiencias del usuario inteligentes, responsivas y personalizadas en el navegador ahora mismo. Pronto, tu inversión en el enfoque de la IA web debería dar sus frutos a medida que los dispositivos sean más capaces de ejecutar LLM.

Ponte al día con Google I/O 2025

Lanzamos todas las charlas de Google I/O 2025, con una playlist dedicada a los desarrolladores web. Mira aún más en io.google/2025.