Google ha dado un paso más en la evolución de su inteligencia artificial con el lanzamiento oficial de Gemini 2.5 Pro y Flash, ahora disponibles de manera general para todos los usuarios. Pero eso no es todo: junto con estas versiones, la compañía también presentó un nuevo modelo en vista previa llamado Gemini 2.5 Flash-Lite, diseñado específicamente para tareas de alto rendimiento como clasificación o resúmenes a gran escala. Sin embargo, la mejora que más ha llamado la atención es la posibilidad de subir y analizar videos directamente en Gemini, una funcionalidad que da ventaja frente a otras plataformas como ChatGPT.
Análisis de video ya disponible en Gemini para Android y web
Según reportó el medio especializado 9to5Google, los usuarios ya pueden subir clips de video desde sus dispositivos Android y recibir análisis detallados por parte de Gemini. El procedimiento es simple y similar al de adjuntar una imagen: basta con presionar el botón “+” en la interfaz del asistente y seleccionar el video desde la galería del dispositivo.
Una vez subido, el usuario puede pedir a Gemini que resuma lo que ocurre en el clip, identifique objetos o personas específicas, o incluso que determine en qué lugar se grabó. En algunos casos, Gemini es capaz de estimar con notable precisión la ubicación y hasta el marco temporal en que se realizó la grabación, utilizando tanto el contenido visual como el audio del video.
De los videos de YouTube a clips personales
Hasta ahora, Gemini ya ofrecía herramientas para resumir videos de YouTube, pero esta nueva capacidad amplía enormemente su utilidad. La IA ahora puede interactuar directamente con videos personales grabados por el usuario, ofreciendo respuestas detalladas y mostrando encima de cada respuesta la parte del video correspondiente.
No obstante, la función aún no permite grabar un video directamente desde la aplicación; solo se pueden subir archivos existentes. El visor de la cámara sigue estando limitado a capturar y adjuntar fotos.
Una clara ventaja frente a ChatGPT
Esta nueva función posiciona a Gemini como un serio competidor frente a ChatGPT. Mientras que la herramienta de OpenAI puede analizar imágenes, documentos o incluso feeds de cámara en tiempo real a través de su función ChatGPT Live, actualmente no admite la carga de videos para su análisis posterior. Esto otorga a Gemini una ventaja estratégica, especialmente en aplicaciones educativas, periodísticas o empresariales donde el contenido visual es clave.
¿Ya puedes usarlo?
Por ahora, la función de análisis de video en Gemini ya está disponible en varios dispositivos Android y en la versión web, aunque aún no ha llegado a todos los usuarios de iOS. Si deseas comprobar si ya puedes usar esta nueva función, simplemente intenta cargar un clip de video en Gemini desde tu teléfono o computadora.
En pruebas recientes, la herramienta demostró ser sorprendentemente precisa, incluso reconociendo lugares específicos y proporcionando contexto temporal. Este avance marca un punto clave en el desarrollo de asistentes de IA más completos, multimodales y útiles para el día a día.
Con este nuevo paso, Google refuerza su apuesta por una inteligencia artificial más integrada con nuestras experiencias visuales, dando a los usuarios herramientas más potentes para interactuar con su contenido personal. Gemini se proyecta así no solo como un asistente conversacional, sino como un analista multimedia completo con potencial para transformar la forma en que entendemos y usamos nuestros propios videos.