Google sigue ampliando las capacidades multimodales de Gemini, y esta vez lo hace con una de las funciones más solicitadas: la posibilidad de subir archivos de audio directamente en la aplicación, disponible tanto en Android, iOS como en la versión web.
La noticia fue confirmada por Josh Woodward, Vicepresidente de Google Labs y Gemini, quien detalló que los usuarios ya pueden cargar archivos en formatos como MP3, WAV u otros tipos compatibles. Para hacerlo, basta con presionar el ícono “+” y seleccionar la opción “Subir archivos”.
Límites de uso: gratis vs. suscriptores
Al igual que con otros formatos, Google estableció límites de carga según el tipo de cuenta:
- Usuarios gratuitos: hasta 10 archivos por consulta, con un tiempo máximo combinado de 10 minutos de audio.
- Suscriptores de Google AI Pro y AI Ultra: un límite ampliado de hasta 3 horas de audio, ideal para grabaciones extensas.
Este rango abre la puerta a múltiples aplicaciones, como grabar y procesar reuniones, convertir notas de clases en texto o analizar fragmentos de pódcast.
Audio vs. Video: una ventaja clave
Si bien 10 minutos puede parecer poco, en realidad duplica el límite de los videos para cuentas gratuitas, que actualmente es de solo 5 minutos (y hasta 1 hora total para usuarios de pago). Esto convierte al audio en una alternativa más flexible y versátil para quienes buscan aprovechar la IA en tareas cotidianas o profesionales.
Un paso más hacia la multimodalidad
Con esta actualización, Gemini amplía sus posibilidades de entrada, sumando el audio a los ya disponibles textos, imágenes y videos. Se trata de un avance clave en la visión de Google por ofrecer un asistente de IA multimodal capaz de adaptarse a distintos contextos y necesidades.
En resumen, la llegada de la carga de audio en Gemini representa un salto importante para estudiantes, profesionales y creadores de contenido, quienes ahora cuentan con una herramienta más eficiente para transformar grabaciones en información útil.