Anthropic lanza Claude Opus 4.5: buenas y malas de un modelo que “lo entiende todo” en código

Anthropic presentó Opus 4.5, un modelo que, según la empresa, supera a humanos y rivales en tareas de ingeniería de software y código. La mejora en precisión y coste lo vuelve atractivo para empresas y desarrolladores, aunque las cuotas de uso y los reinicios cada cinco horas generan frustración entre sus suscriptores pagos.

Anthropic dio un paso adelante en la carrera por los modelos potentes con Claude Opus 4.5, disponible hoy en sus apps, en la API y en las tres principales plataformas cloud. La compañía destaca que Opus 4.5 logra un 80,9% de precisión en SWE-Bench Verified, el benchmark de referencia para evaluar capacidades de ingeniería de software, y que supera a cualquier candidato humano en su exigente prueba interna con límite de 2 horas. Según Anthropic, “Opus 4.5 simplemente lo entiende”, frase que repitieron varios probadores durante las pruebas internas.

La diferencia técnica no es menor: Opus 4.5 incorpora mejoras en visión, razonamiento, matemáticas y, sobre todo, en programación. Anthropic asegura que el modelo resuelve bugs complejos y maneja ambigüedad y tradeoffs sin necesidad de “tomar de la mano” al usuario. Además, la empresa ha introducido el parámetro de “esfuerzo” (bajo, medio, alto) para que desarrolladores controlen cuánto tiempo y tokens invierte el modelo en cada tarea, una mecánica pensada para balancear precisión y coste.

Más rendimiento, menos coste —en el papel

En términos económicos, Anthropic bajó su tarifa de API de U$S 15 / U$S 75 por millón de tokens (entrada/salida) a U$S 5 / U$S 25 por millón, buscando hacer las capacidades Opus accesibles a más equipos y empresas. Desde el punto de vista de eficiencia, el modelo también promete mejoras concretas: en modo medio iguala a Sonnet 4.5 consumiendo un 76% menos de tokens; en modo alto supera a Sonnet 4.5 por 4,3 puntos porcentuales usando un 48% menos de tokens. Para proyectos a escala, eso puede traducirse en saltos importantes de eficiencia de costes.

Junto al modelo, Anthropic actualizó su Claude Developer Platform y funciones de producto: Claude Code mejora su modo de planificación (hace preguntas aclaratorias antes de generar archivos), Claude for Chrome y Claude for Excel —ambos dirigidos a usuarios Max/Team— amplían integraciones con el navegador y hojas de cálculo, y la plataforma añade resúmenes automáticos para “conversaciones infinitas” que ya no cortan con límites de contexto.

El gran problema —experiencia de uso y límites de cuota

Pese a las mejoras técnicas y la reducción de precios, el principal escollo para la adopción es práctico: los límites de uso. Los tokens de Opus se consumen rápidamente y las cuotas se agotan incluso para suscriptores Pro y Max; además, las cuentas tardan cinco horas en reiniciar desde el primer mensaje enviado. Ese comportamiento genera molestia en usuarios que pagan entre U$S 20 y U$S 100 al mes (y en algunos planes Max que rondan U$S 100–200), porque la sensación es que el acceso efectivo al modelo premium queda restringido por límites operativos, no solo por precio. Anthropic ha aumentado ligeramente los límites para algunos niveles (Max y Team Premium), pero la experiencia aún dista de lo esperado para servicios de este nivel.

Implicancias para empresas y desarrolladores

El lanzamiento restablece la arquitectura de productos de Anthropic: con Haiku, Sonnet y Opus claramente diferenciados por coste, velocidad y capacidad, la compañía se posiciona como proveedor premium para profesionales del conocimiento y equipos de desarrollo —incluso empresas como Meta usan Claude internamente para asistentes de código como Devmate, según el propio comunicado—. Para empresas que requieren precisión en programación, razonamiento visual y gestión de agentes, Opus 4.5 representa una herramienta potente y más asequible en coste por token.

Sin embargo, la viabilidad comercial dependerá de que Anthropic resuelva la tensión entre potencia y disponibilidad: si los límites de consumo continúan interrumpiendo flujos de trabajo críticos, la promesa de productividad podría diluirse en frustración operativa. En la práctica, los clientes que más valor podrían extraer del modelo son justamente quienes hoy se ven más penalizados por esas cuotas.

¿Qué viene ahora?

Anthropic apuesta por consolidarse frente a OpenAI y Google en el nicho donde la precisión y la confiabilidad importan —herramientas para programadores, investigación profunda y producción profesional—. La próxima prueba para Opus 4.5 no será solo técnica, sino de producto: convertir esa potencia en una experiencia utilizable y estable para equipos que dependen del modelo en tareas reales de negocio. Si resuelve los límites de uso, Opus 4.5 puede cambiar flujos de trabajo; si no, correrá el riesgo de quedarse como una promesa técnica con fricciones de producto.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com