Anthropic lanza Claude Sonnet 4.6: más potente, con ventana de 1 millón de tokens y mejoras clave

La nueva versión se convierte en el modelo por defecto en claude.ai y promete rendimiento cercano a Opus a un costo desde U$S 3 por millón de tokens. Con avances en programación, razonamiento de largo contexto y automatización de software legacy, Anthropic acelera la competencia en IA empresarial.

La carrera por modelos más capaces y económicamente viables suma un nuevo capítulo. Anthropic presentó Claude Sonnet 4.6, una actualización integral que eleva el desempeño en programación, razonamiento de largo contexto, planificación de agentes, tareas de oficina con impacto económico y uso autónomo de computadoras. Además, incorpora en fase beta una ventana de contexto de 1 millón de tokens, suficiente para procesar bases de código completas, contratos extensos o decenas de papers en una sola consulta.

El nuevo modelo pasa a ser el predeterminado para los planes Free y Pro en claude.ai y Claude Cowork. La estructura de precios se mantiene respecto a la versión 4.5, comenzando en U$S 3 por millón de tokens de entrada y U$S 15 por millón de tokens de salida.

Rendimiento cercano a Opus, pero a menor costo

Según la compañía, desarrolladores con acceso anticipado prefirieron Sonnet 4.6 frente a su predecesor en aproximadamente 70% de los casos dentro de Claude Code. Incluso lo eligieron por sobre Claude Opus 4.5 —el modelo insignia presentado en noviembre de 2025— en 59% de las comparaciones.

Los usuarios reportaron que el modelo “lee mejor el contexto antes de modificar código”, consolida lógica compartida en lugar de duplicarla y resulta menos propenso a sobreingeniería o “pereza”. También señalaron menos afirmaciones falsas de éxito, menos alucinaciones y mayor consistencia en tareas de múltiples pasos.

Anthropic sostiene que ahora es posible acceder a desempeño que antes requería un modelo de clase Opus, pero a un precio más accesible para tareas empresariales cotidianas.

Uso de computadoras: de experimental a nivel casi humano

Uno de los avances más destacados es en computer use, la capacidad del modelo para interactuar con software como lo haría una persona: haciendo clic con un mouse virtual y escribiendo con un teclado virtual, sin necesidad de APIs específicas.

La compañía fue la primera en introducir un modelo de propósito general para uso de computadoras en octubre de 2024, que en ese momento describió como “todavía experimental—en ocasiones engorroso y propenso a errores”. Dieciséis meses después, el progreso es sustancial.

En el benchmark OSWorld —que evalúa tareas en software real como Chrome, LibreOffice y VS Code en un entorno simulado— los modelos Sonnet han mostrado mejoras sostenidas. Usuarios tempranos de la versión 4.6 ya observan capacidades cercanas al nivel humano en tareas como navegar hojas de cálculo complejas o completar formularios web de múltiples pasos integrando información en varias pestañas.

Aun así, Anthropic reconoce que el modelo todavía no alcanza a los humanos más expertos en el uso de computadoras. Pero la velocidad de avance sugiere que la automatización de software legacy —históricamente difícil de integrar— podría expandirse con rapidez.

Seguridad y resistencia a ataques

El avance en automatización también trae riesgos. Los ataques de “prompt injection”, donde actores maliciosos ocultan instrucciones en páginas web para manipular al modelo, son una preocupación central.

Anthropic afirma que sus evaluaciones de seguridad muestran que Sonnet 4.6 es “tan seguro o más seguro” que sus modelos recientes y que exhibe “un carácter ampliamente cálido, honesto, prosocial y en ocasiones divertido, comportamientos de seguridad muy sólidos y sin señales de grandes preocupaciones en torno a formas de desalineación de alto riesgo”.

En pruebas internas, el modelo mostró una mejora significativa en resistencia a inyecciones de prompt frente a Sonnet 4.5, con desempeño similar a Opus 4.6.

Estrategia, planificación y contexto extendido

La ventana de 1 millón de tokens no solo amplía la cantidad de información que puede procesarse, sino también la calidad del razonamiento a largo plazo. En la evaluación Vending-Bench Arena —donde modelos compiten gestionando un negocio simulado para maximizar ganancias— Sonnet 4.6 adoptó una estrategia distintiva: invirtió agresivamente durante los primeros 10 meses simulados, gastando más que sus competidores, para luego pivotar hacia la rentabilidad en la fase final, logrando terminar claramente por delante.

Este tipo de planificación estratégica refuerza el posicionamiento del modelo en aplicaciones corporativas, desde análisis financiero hasta diseño frontend. Clientes tempranos reportaron que los resultados visuales presentan mejores layouts, animaciones y coherencia de diseño, requiriendo menos iteraciones para alcanzar calidad de producción.

Integración empresarial y ecosistema

En la plataforma para desarrolladores, Sonnet 4.6 soporta adaptive thinking, extended thinking y compresión automática de contexto en beta. En la API, las herramientas de búsqueda web ahora escriben y ejecutan código automáticamente para filtrar resultados, mejorando eficiencia de tokens.

Para usuarios de Claude en Excel, el complemento ahora admite conectores MCP con proveedores como S&P Global, LSEG, Daloopa, PitchBook, Moody’s y FactSet, permitiendo traer datos externos sin salir de la hoja de cálculo.

Una pieza clave en la competencia por la IA empresarial

Sonnet 4.6 está disponible en todos los planes de Claude, incluida la versión gratuita —que ahora incorpora creación de archivos, conectores y compaction— así como en la API y principales nubes públicas.

Mientras Opus 4.6 sigue siendo la opción más robusta para tareas de razonamiento extremo, la estrategia de Anthropic parece clara: llevar capacidades de frontera a un rango de precio que facilite adopción masiva en entornos productivos.

En un mercado donde la diferenciación ya no pasa solo por quién tiene el modelo “más inteligente”, sino por quién logra el mejor equilibrio entre costo, seguridad y rendimiento real en tareas económicas, Claude Sonnet 4.6 se presenta como un movimiento táctico de alto impacto.

Colección de categorías

Anthropic lanza Claude Sonnet 4.6: más potente, con ventana de 1 millón de tokens y mejoras clave

Rendimiento cercano a Opus, pero a menor costo

Uso de computadoras: de experimental a nivel casi humano

Seguridad y resistencia a ataques

Estrategia, planificación y contexto extendido

Integración empresarial y ecosistema

Una pieza clave en la competencia por la IA empresarial

Deja una respuesta Cancelar la respuesta

Colección de categorías

Rendimiento cercano a Opus, pero a menor costo

Uso de computadoras: de experimental a nivel casi humano

Seguridad y resistencia a ataques

Estrategia, planificación y contexto extendido

Integración empresarial y ecosistema

Una pieza clave en la competencia por la IA empresarial

Deja una respuesta Cancelar la respuesta

Noticias Relacionadas