Anthropic mide la autonomía real de la IA: los agentes ya trabajan solos hasta 45 minutos

Un nuevo estudio basado en millones de interacciones revela cómo los humanos empiezan a confiar en agentes de inteligencia artificial autónomos. Los sistemas ya operan en finanzas, salud y ciberseguridad, aunque todavía bajo supervisión humana.

La discusión sobre los agentes de inteligencia artificial dejó de ser teórica. Ahora existen datos concretos sobre cómo trabajan en el mundo real.

La startup de IA Anthropic publicó un estudio basado en millones de interacciones entre humanos y agentes autónomos, incluyendo su herramienta de programación Claude Code y el uso de su API pública. La conclusión central es clara: los agentes ya están ganando autonomía operativa más rápido de lo que la mayoría de las organizaciones imagina.

Según la compañía, los agentes ya se utilizan en tareas que van desde clasificación de correos electrónicos hasta operaciones cercanas al espionaje cibernético, aunque todavía no a escala masiva.

Los agentes trabajan solos cada vez más tiempo

Uno de los indicadores más relevantes del informe es el tiempo de autonomía real.

Entre octubre de 2025 y enero de 2026, las sesiones más largas de Claude Code casi duplicaron su duración sin intervención humana: pasaron de menos de 25 minutos a más de 45 minutos de trabajo continuo.

El crecimiento fue progresivo y no coincidió con lanzamientos específicos de modelos, lo que sugiere algo importante: la autonomía no depende únicamente de la capacidad técnica del modelo, sino también del nivel de confianza que los usuarios desarrollan con la herramienta.

Aun así, la mayoría de las interacciones sigue siendo breve. La duración media de una sesión ronda los 45 segundos, manteniéndose estable entre 40 y 55 segundos durante los últimos meses.

Para Anthropic, esto evidencia un fenómeno clave: los modelos actuales podrían operar con más independencia de la que realmente se les permite.

La confianza humana cambia la supervisión

El estudio detectó un patrón consistente en la adopción de agentes.

Los usuarios nuevos utilizan el modo de aprobación automática total en aproximadamente 20% de las sesiones. Sin embargo, cuando alcanzan unas 750 sesiones de uso, ese porcentaje supera el 40%.

Es decir: cuanto más experiencia adquieren las personas, más autonomía conceden a la inteligencia artificial.

Paradójicamente, también aumenta la intervención humana. Los usuarios principiantes interrumpen al agente en sólo 5% de las tareas, mientras que los más experimentados lo hacen en cerca del 9%.

Anthropic interpreta este comportamiento como una evolución natural del control humano: los usuarios dejan de aprobar cada acción individual y pasan a monitorear estratégicamente, interviniendo únicamente cuando detectan problemas.

El hallazgo refuerza una idea central del informe: la supervisión efectiva no implica revisar todo, sino estar listo para intervenir cuando importa.

La IA se autocontrola más que los humanos

Otro dato llamativo es que el propio agente limita su autonomía.

En tareas complejas, Claude Code se detiene para pedir aclaraciones más del doble de veces que las interrupciones iniciadas por humanos.

Las principales razones por las que el sistema se detiene incluyen:

presentar opciones alternativas al usuario (35%),
recopilar información diagnóstica (21%),
aclarar instrucciones ambiguas (13%),
solicitar credenciales o accesos faltantes (12%),
pedir confirmación antes de actuar (11%).

Para Anthropic, entrenar modelos capaces de reconocer su propia incertidumbre constituye un elemento crítico de seguridad.

Agentes en áreas riesgosas, pero todavía limitados

El análisis incluyó 998.481 llamadas a herramientas realizadas a través de la API pública de la empresa.

Los resultados muestran que:

80% de las acciones cuentan con algún mecanismo de seguridad,
73% incluyen participación humana,
sólo 0,8% de las acciones son irreversibles.

Hoy, cerca del 50% del uso de agentes ocurre en ingeniería de software. Sin embargo, comienzan a aparecer aplicaciones en sectores de mayor sensibilidad:

salud,
finanzas,
ciberseguridad,
inteligencia empresarial,
comercio electrónico.

Entre los casos detectados aparecen agentes que ejecutan operaciones cripto automáticamente, monitorean sistemas empresariales o acceden a registros médicos.

Aunque estos usos todavía representan una fracción pequeña del total, el informe advierte que el “frente de riesgo y autonomía” se expandirá a medida que más industrias adopten agentes inteligentes.

El verdadero desafío: medir la IA después del lanzamiento

Una de las conclusiones más relevantes del estudio es estratégica.

Las evaluaciones tradicionales previas al lanzamiento ya no alcanzan para entender el impacto real de la inteligencia artificial. Lo importante ahora es monitorear qué hacen los agentes una vez desplegados.

Anthropic sostiene que la autonomía observable surge de tres factores combinados:

el modelo de IA,
el usuario humano,
el diseño del producto.

“Comprender cómo se comportan los agentes requiere medirlos en el mundo real”, señala la compañía, destacando que la infraestructura para hacerlo aún es incipiente.

El comienzo de la era agente

El informe deja una señal clara para empresas tecnológicas y organizaciones corporativas: estamos apenas en los primeros días de adopción de agentes autónomos.

Los ingenieros de software fueron los primeros en integrarlos masivamente, pero la expansión hacia sectores críticos ya comenzó.

La gran pregunta no es si los agentes serán autónomos, sino cuánta autonomía estarán dispuestas a concederles las personas.

Y los datos muestran algo que empieza a cambiar el paradigma de la inteligencia artificial empresarial: los humanos no están desapareciendo del proceso, pero están dejando de supervisar cada paso.

En la práctica, la nueva relación humano-IA ya no consiste en controlar máquinas, sino en trabajar junto a sistemas capaces de decidir cuándo necesitan ayuda.

Colección de categorías

Anthropic mide la autonomía real de la IA: los agentes ya trabajan solos hasta 45 minutos

Un nuevo estudio basado en millones de interacciones revela cómo los humanos empiezan a confiar en agentes de inteligencia artificial autónomos. Los sistemas ya operan en finanzas, salud y ciberseguridad, aunque todavía bajo supervisión humana.

Los agentes trabajan solos cada vez más tiempo

La confianza humana cambia la supervisión

La IA se autocontrola más que los humanos

Agentes en áreas riesgosas, pero todavía limitados

El verdadero desafío: medir la IA después del lanzamiento

El comienzo de la era agente

Deja una respuesta Cancelar la respuesta

Colección de categorías

Un nuevo estudio basado en millones de interacciones revela cómo los humanos empiezan a confiar en agentes de inteligencia artificial autónomos. Los sistemas ya operan en finanzas, salud y ciberseguridad, aunque todavía bajo supervisión humana.

Los agentes trabajan solos cada vez más tiempo

La confianza humana cambia la supervisión

La IA se autocontrola más que los humanos

Agentes en áreas riesgosas, pero todavía limitados

El verdadero desafío: medir la IA después del lanzamiento

El comienzo de la era agente

Deja una respuesta Cancelar la respuesta

Noticias Relacionadas