Google revoluciona la inteligencia artificial con el lanzamiento de Gemini 2.5 Computer Use

Google ha dado un nuevo paso gigante en el campo de la inteligencia artificial con el lanzamiento de Gemini 2.5 Computer Use, un modelo diseñado no solo para generar respuestas, sino también para interactuar directamente con la web como lo haría un ser humano. Basado en la arquitectura de Gemini 2.5 Pro, este avance redefine lo que significa “usar” una IA, ya que puede realizar acciones reales en línea de forma autónoma.

Una IA que actúa, no solo responde

Según explicó la compañía en un comunicado oficial, Gemini 2.5 Computer Use es capaz de interactuar con interfaces de usuario, lo que le permite realizar tareas como hacer clic, escribir, desplazarse por páginas, llenar formularios o abrir menús desplegables. En palabras simples, esta IA puede “usar” una computadora a través del navegador.

Google asegura que el modelo supera a sus competidores en diversos parámetros de rendimiento, además de ofrecer una latencia más baja que otros sistemas similares. Por ahora, el modelo admite 13 acciones distintas, y aunque todavía no está optimizado para controlar sistemas operativos de escritorio, marca un hito en la evolución de los agentes inteligentes.

Acceso para desarrolladores y primeras demostraciones

Los desarrolladores ya pueden acceder al modelo a través de Google AI Studio y Vertex AI, plataformas que permiten probar e integrar sus capacidades en aplicaciones o flujos de automatización. Para demostrar su funcionamiento, Google publicó varios videos (acelerados tres veces) donde Gemini 2.5 Computer Use realiza tareas completas desde cero.

En uno de los ejemplos, la IA recibe la instrucción:

“Mi club de arte organizó tareas para nuestra feria. El tablero es un caos y necesito tu ayuda para clasificar las notas según las categorías que creé. Entra a stick-note-jam.web.app y organiza las notas correctamente. Arrástralas si es necesario.”

Gemini 2.5 navega por la web, identifica las notas, las arrastra a las secciones correctas y completa la tarea tal como lo haría una persona real. Este tipo de demostraciones revela el enorme potencial que tiene la herramienta para automatizar procesos cotidianos de manera visual e intuitiva.

Aplicaciones prácticas y futuro prometedor

Aunque la función todavía se encuentra en una fase inicial, Google ya está utilizando el modelo internamente para pruebas de interfaces de usuario (UI testing), lo que podría acelerar drásticamente los tiempos de desarrollo y depuración de software. Además, la empresa confirmó que versiones adaptadas de esta tecnología ya impulsan funciones inteligentes en herramientas como AI Mode en Search, Firebase Testing Agent y Project Mariner, una plataforma experimental que permite asignar agentes de IA para tareas diarias como investigación, planificación o entrada de datos.

Un paso más hacia la automatización total

Con Gemini 2.5 Computer Use, Google da un paso firme hacia un futuro donde la inteligencia artificial no solo entienda lo que queremos, sino que tenga la capacidad de hacerlo por nosotros.

Este avance sitúa a Google a la vanguardia de la nueva era de los agentes autónomos, capaces de ejecutar acciones reales en la web y transformar la manera en que las personas y empresas interactúan con la tecnología. En definitiva, el futuro de la IA ya no es solo conversacional: es operativo.