Anthropic presentó oficialmente Claude Opus 4.6, su nuevo modelo de inteligencia artificial, marcando un avance clave dentro de la familia Opus. Este lanzamiento llega como una actualización directa del Opus 4 original y busca resolver varias de las limitaciones detectadas en versiones anteriores, especialmente en tareas complejas y de largo alcance como la ingeniería de software, el análisis financiero, el derecho y los trabajos intensivos en conocimiento.
Si bien Claude Opus 4.5 ya era reconocido por su capacidad para resolver problemas avanzados, en escenarios exigentes tendía a fallar en casos límite o en contextos extensos que requieren planificación sostenida. Con Opus 4.6, Anthropic apunta directamente a ese problema y lo hace con una mejora contundente: un context window de hasta un millón de tokens, lo que equivale aproximadamente a 750.000 palabras. En términos prácticos, esto permite analizar bases de datos masivas, repositorios de código completos o documentos extensos sin perder coherencia ni precisión.
¿Qué trae de nuevo Claude Opus 4.6?
Según detalló Anthropic en su publicación oficial, esta es la primera vez que un modelo de la línea Opus alcanza el umbral del millón de tokens de contexto, un salto significativo frente a los 200.000 tokens disponibles anteriormente. Esto habilita interacciones mucho más largas y profundas, ideales para proyectos complejos y flujos de trabajo prolongados.
Además del contexto ampliado, Opus 4.6 introduce nuevas funciones clave. Una de ellas es la compresión de contexto, que permite resumir y refrescar información durante tareas extensas sin perder datos críticos. También incorpora pensamiento adaptativo, un sistema que ajusta el nivel de razonamiento según la complejidad del problema, y controles de esfuerzo, que van de bajo a máximo para equilibrar costos, velocidad y profundidad analítica.
Resultados en benchmarks: números que impresionan
En el terreno de las evaluaciones técnicas, Claude Opus 4.6 muestra un desempeño sobresaliente. De acuerdo con pruebas internas de la compañía, el modelo lidera Terminal-Bench 2.0 en habilidades de línea de comandos y Humanity’s Last Exam, una evaluación centrada en razonamiento transversal entre múltiples dominios.
También se destaca en evaluaciones tipo agente como GDPval-AA, donde supera a GPT-5.2 de OpenAI por aproximadamente 144 puntos Elo, y mejora a Opus 4.5 por cerca de 190 puntos, especialmente en tareas financieras y legales. En SWE-bench Verified, alcanza un promedio del 81,42 % con prompting optimizado, mientras que los resultados en CyberGym muestran un rendimiento sólido incluso sin pasos explícitos de razonamiento.
Seguridad y confiabilidad
Anthropic asegura que Opus 4.6 obtiene mejores calificaciones que sus competidores en auditorías de seguridad. El modelo presenta menor tendencia a la complacencia, menos comportamientos engañosos y una reducción en rechazos innecesarios frente a solicitudes válidas. Además, se incorporaron seis nuevas pruebas de ciberseguridad diseñadas para detectar posibles usos indebidos del sistema.
Un aliado potente para código, negocios y ciencia
En programación, Claude Opus 4.6 puede gestionar repositorios de gran tamaño de forma autónoma, realizar revisiones de código, depurar errores con alta precisión y coordinar equipos de agentes para desarrollo paralelo a través del avance experimental de Claude Code.
En el ámbito empresarial, se desempeña con solvencia en análisis financiero, creación de documentos y procesos de investigación de múltiples pasos. Herramientas como Claude en Excel ahora admiten datos no estructurados y flujos de trabajo más extensos, mientras que una vista previa de Claude en PowerPoint traslada estas capacidades al terreno de las presentaciones. En áreas especializadas como la biología computacional, Anthropic afirma que el rendimiento es casi el doble que el de Opus 4.5, acelerando significativamente la investigación científica.
Precio y disponibilidad
Claude Opus 4.6 ya está disponible en el sitio oficial de Anthropic, así como en sus aplicaciones móviles y de escritorio, su API y principales proveedores de nube. El precio del API comienza en 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, con planes premium que ofrecen ventanas de contexto aún más amplias.
Con este lanzamiento, Anthropic deja claro que la carrera por modelos más potentes, confiables y escalables sigue acelerándose, y Claude Opus 4.6 se posiciona como uno de los contendientes más sólidos del momento.
