Google presenta Gemini 3.5 Live Translate: traducción de voz en tiempo real para conversaciones más naturales

Google ha dado un nuevo paso en su misión de eliminar las barreras lingüísticas con el lanzamiento de Gemini 3.5 Live Translate, un innovador modelo de inteligencia artificial capaz de traducir conversaciones habladas en tiempo real. La nueva tecnología promete transformar la forma en que las personas se comunican en distintos idiomas, ofreciendo una experiencia mucho más fluida y natural que los sistemas de traducción tradicionales.

Traducción instantánea sin interrupciones

A diferencia de muchas herramientas actuales que requieren que los interlocutores hagan pausas para esperar la traducción, Gemini 3.5 Live Translate procesa el audio mientras la persona está hablando. Esto permite que la voz traducida se genere apenas unos segundos después de la intervención original, manteniendo el ritmo natural de la conversación.

Según Google, esta capacidad permite que reuniones internacionales, clases virtuales, transmisiones en vivo y conversaciones de atención al cliente se desarrollen de manera mucho más dinámica, sin los retrasos que suelen afectar la comunicación multilingüe.

Más de 70 idiomas compatibles

Uno de los aspectos más destacados de Gemini 3.5 Live Translate es su capacidad para reconocer y cambiar automáticamente entre más de 70 idiomas. Los usuarios ya no tendrán que seleccionar manualmente el idioma de origen o destino, ya que el sistema identifica el idioma hablado y realiza la traducción de forma automática.

Además, la tecnología busca preservar características esenciales del habla, como el tono de voz, el ritmo y la entonación, logrando que las traducciones suenen más cercanas a la voz original y menos como una narración robótica.

Diseñado para entornos reales

Google afirma que el nuevo modelo ha sido optimizado para funcionar incluso en ambientes ruidosos o impredecibles, donde los sonidos de fondo suelen afectar la precisión de las traducciones automáticas.

Gracias a esta mejora, Gemini 3.5 Live Translate podría resultar especialmente útil en eventos, conferencias, espacios públicos y situaciones donde las condiciones de audio no son ideales.

Google Meet amplía sus capacidades multilingües

La compañía también anunció que esta tecnología llegará a Google Meet, ampliando significativamente las opciones de traducción dentro de la plataforma de videoconferencias.

Hasta ahora, Google Meet ofrecía soporte para solo cinco idiomas en sus funciones de traducción. Con la integración de Gemini 3.5 Live Translate, el servicio pasará a admitir más de 70 idiomas, facilitando la colaboración entre equipos internacionales y usuarios de diferentes regiones del mundo.

Integración con Google Translate

La nueva tecnología también será incorporada a la aplicación Google Translate para dispositivos Android e iOS.

Los usuarios podrán escuchar las traducciones directamente a través de audífonos compatibles conectados a sus dispositivos, lo que facilitará las conversaciones cara a cara entre personas que hablan distintos idiomas.

En el caso de Android, Google añade una función denominada Listening Mode, que permitirá reproducir el audio traducido directamente a través del auricular del teléfono.

Seguridad y transparencia con marcas de agua de IA

Ante las crecientes preocupaciones sobre el contenido generado por inteligencia artificial, Google confirmó que todo el audio creado mediante Gemini 3.5 Live Translate incluirá SynthID, su tecnología de marca de agua digital.

Esta identificación se integra directamente en los archivos de audio generados por IA y permite verificar posteriormente que dicho contenido fue producido utilizando sistemas de inteligencia artificial.

Herramientas para desarrolladores

Google también ha abierto el acceso a Gemini 3.5 Live Translate para desarrolladores mediante una vista previa pública disponible en Google AI Studio y a través de la Gemini Live API.

Para facilitar la adopción de la tecnología, la compañía ha establecido alianzas con plataformas como Agora, Fishjam, LiveKit, Pipecat y Vision Agents, permitiendo a los desarrolladores crear rápidamente aplicaciones de traducción de voz y experiencias multilingües impulsadas por inteligencia artificial.

Un futuro con menos barreras lingüísticas

Con el lanzamiento global de Gemini 3.5 Live Translate, Google busca acercar aún más la comunicación entre personas de diferentes idiomas y culturas. La combinación de traducción en tiempo real, soporte para más de 70 idiomas, preservación de la voz original y herramientas para desarrolladores posiciona a esta tecnología como uno de los avances más importantes en traducción automática impulsada por inteligencia artificial.

La implementación de Gemini 3.5 Live Translate ya ha comenzado en los productos y servicios compatibles de Google a nivel mundial, marcando una nueva etapa en la evolución de la comunicación global.