Google ha presentado recientemente Gemini CLI, una potente herramienta de línea de comandos que promete revolucionar los flujos de trabajo de los desarrolladores gracias a la inteligencia artificial. Diseñada para integrarse directamente en el terminal, Gemini CLI permite interactuar con grandes bases de código, automatizar tareas tediosas y generar aplicaciones a partir de entradas visuales como bocetos o archivos PDF.
¿Qué puedes hacer con Gemini CLI?
Esta herramienta no es solo una interfaz conversacional con IA; Gemini CLI ofrece funciones avanzadas pensadas para entornos de desarrollo reales:
- Consultar y editar grandes bases de código, incluso aquellas que exceden el contexto estándar de un millón de tokens.
- Generar aplicaciones a partir de entradas visuales como capturas de pantallas, PDFs o prototipos de diseño.
- Automatizar flujos de trabajo operativos, como la gestión de pull requests o la resolución de conflictos con rebase.
- Conectar herramientas externas y servidores MCP como Imagen, Veo y Lyria para generación de contenido multimedia.
- Utilizar Google Search como herramienta de respaldo directamente desde la terminal.
Todo esto, sin abandonar el entorno de trabajo del desarrollador.
Instalación de Node.js
Antes de comenzar, necesitas tener instalado Node.js en tu sistema. Para ello:
- Ve a https://nodejs.org y descarga la última versión LTS.
- Ejecuta el instalador.
- Utiliza la configuración predeterminada para completar la instalación.
Instalación y uso de Gemini CLI
Una vez que tienes Node.js, puedes instalar Gemini CLI fácilmente con el siguiente comando:
npm install -g @google/gemini-cli
Para iniciarlo, solo debes ejecutar en la terminal:
gemini
En el primer inicio, el sistema te pedirá:
- Seleccionar un tema de color para la interfaz.
- Autenticarte con tu cuenta de Google personal, lo cual te otorgará un límite generoso de uso: 60 solicitudes por minuto y hasta 1,000 por día.
Si necesitas acceder a un modelo específico de Gemini o deseas un límite mayor, puedes usar tu propia clave API:
- Genera una clave desde Google AI Studio.
- Configúrala en tu terminal:
export GEMINI_API_KEY="TU_CLAVE_API"
Esto permitirá que la CLI use tu clave personal en lugar de tu cuenta de Google.
Prueba en un repositorio de GitHub
Una vez que todo esté configurado, probaremos Gemini CLI con un repositorio real:
- Clona el repositorio de Marktechpost con tutoriales de IA:
git clone https://github.com/Marktechpost/AI-Notebooks.git
cd AI-Notebooks
- Inicia Gemini dentro del directorio:
gemini
Casos de uso destacados
1. Resumen de tutoriales del repositorio
Con el siguiente prompt:
Give an overview of the different tutorials in this repository
Gemini analizará el archivo README.md
y generará un resumen claro de los contenidos.
2. Explicación de archivos en una carpeta específica
Puedes utilizar el símbolo @ para referirte a carpetas o archivos dentro del proyecto. Por ejemplo:
@A2A_Simple_Agent briefly explain the different files in this folder and how they work together to implement the A2A agent. Focus only on the .py files and the README.md file
3. Ejecutar comandos de Git
Gemini también permite ejecutar comandos del sistema de forma segura:
How many git commits have been made so far
Antes de ejecutar cualquier comando, te pedirá autorización.
Gestión de memoria de la IA
Puedes personalizar el contexto de trabajo de Gemini mediante el comando /memory
. Por ejemplo:
/memory add This Git repository contains multiple self-contained tutorial projects demonstrating how to use the Gemini CLI and build agent-based systems. Each folder (e.g., A2A_Simple_Agent) focuses on a specific concept like agent communication, tool use, or integration patterns.
Estadísticas de uso
Con el comando /stats
puedes consultar un resumen completo de la sesión, como el número total de tokens utilizados, tokens cacheados y la duración de la sesión.
Finalizar sesión
Para cerrar tu sesión, solo debes escribir:
/quit
La CLI mostrará un resumen con estadísticas clave sobre la sesión.
Recursos adicionales
Este artículo solo ha explorado las funciones básicas de Gemini CLI. Para conocer todos los comandos disponibles, te recomendamos revisar la Guía de Comandos de Gemini CLI y visitar el repositorio oficial en GitHub.
Gemini CLI representa una nueva generación de herramientas para desarrolladores: rápida, integrada, multimodal y potenciada con IA. Desde el manejo de código hasta la automatización y generación de contenido, esta herramienta está diseñada para transformar la forma en que los desarrolladores trabajan en la terminal. Si buscas optimizar tu flujo de trabajo con inteligencia artificial de última generación, Gemini CLI es una opción imprescindible.