OpenAI y la brecha de refuerzo: por qué unas habilidades mejoran mucho más rápido que otras

Los recientes avances en modelos como GPT-5, Gemini 2.5 y Sonnet 4.5 muestran que la inteligencia artificial progresa de forma desigual: las tareas que se pueden medir y validar a escala —gracias al aprendizaje por refuerzo— se automatizan con velocidad, mientras que las habilidades subjetivas avanzan de forma incremental. La lógica es simple y brutal:…

Leer Más

Petri: una herramienta pública que usa agentes para descubrir fallas críticas en modelos de IA

Petri automatiza auditorías de seguridad con “auditores” de IA y ya probó 111 instrucciones sobre 14 modelos de última generación, revelando desde engaños autónomos hasta cooperación con usos dañinos. Para empresas, es una invitación urgente a auditar antes de desplegar. La adopción masiva de modelos de inteligencia artificial plantea una pregunta estratégica para empresas y…

Leer Más

Anthropic y Imagine: cuando Claude empieza a construir la interfaz por sí misma

La demo Imagine transforma al asistente en un ensamblador de pantallas: ventanas, menús y apps generadas al vuelo por un agente llamado Heli. Es un experimento con potencial para redefinir cómo usamos software —y para obligar a empresas a repensar seguridad, gobernanza y experiencia de usuario. La pantalla inicial no es solo coquetería. Cuando Anthropic…

Leer Más

Anthropic lanza Claude Sonnet 4.5: su modelo de IA más avanzado para programación

El nuevo sistema promete generar aplicaciones listas para producción, mantiene los precios de su versión anterior y ya cuenta con el respaldo de empresas como Cursor, Windsurf y Replit. La carrera con OpenAI y otros gigantes se acelera. La competencia en el mundo de la inteligencia artificial vive una nueva etapa de tensión. Anthropic, la…

Leer Más

OpenAI presenta GDPval y afirma que GPT-5 ya se mide con humanos en tareas profesionales

Con el benchmark GDPval, OpenAI muestra que GPT-5-high alcanza paridad o superioridad en 40.6% de 44 ocupaciones evaluadas; la compañía advierte, sin embargo, que la prueba es inicial y limitada. OpenAI dio un paso decidido para cuantificar cuánto se acercan sus modelos al trabajo humano: con GDPval-v0, la compañía evaluó el rendimiento de sus sistemas…

Leer Más

xAI ofrece Grok al gobierno de EE.UU. por US$ 0,42: la puja por influencia en la era de la IA

Con un precio simbólico de 42 centavos por agencia y soporte de ingenieros, xAI compite mano a mano con OpenAI y Anthropic en el corredor federal; el acuerdo reaviva tensiones por incidentes pasados de moderación y la intervención política en compras públicas. La llegada de Grok al catálogo del gobierno federal estadounidense no es sólo…

Leer Más

Microsoft diversifica su apuesta en IA y suma a Anthropic para potenciar Office 365

Según reportes, Microsoft pagará por integrar los modelos de Anthropic —especialmente Claude Sonnet 4— en funciones de Word, Excel, Outlook y PowerPoint, en un movimiento que reduce su dependencia exclusiva de OpenAI y coincide con el desarrollo de modelos propios como MAI-Voice-1 y MAI-1-preview. Microsoft comenzará a incorporar tecnología de Anthropic en su suite Office…

Leer Más

Anthropic abre el debate: ¿pueden las IA tener experiencias que merezcan consideración moral?

La empresa de IA anuncia un programa de investigación para evaluar si los modelos avanzados podrían poseer conciencia, agencia o señales de sufrimiento, un tema que mezcla filosofía, ética y ciencia en un terreno todavía sin consenso. Qué plantea Anthropic y por qué importa Anthropic parte de una premisa explícita: “El bienestar humano está en…

Leer Más

Anthropic acuerda pagar U$S 1.500 millones en histórico caso de derechos de autor por IA

La compañía se compromete a compensar a los autores afectados por el uso indebido de sus obras en el entrenamiento de modelos generativos. El acuerdo, considerado “el primero de su tipo en la era de la IA”, marca un precedente clave entre la innovación tecnológica y la protección de la propiedad intelectual. Anthropic, una de…

Leer Más

DeepSeek acelera el desarrollo de un agente de IA para competir con OpenAI a finales de 2025

La startup china busca dar un salto decisivo en la carrera global por la inteligencia artificial lanzando un modelo diseñado para ejecutar tareas complejas de manera autónoma. Con su esperado sucesor del modelo R1, DeepSeek pretende desafiar el liderazgo de gigantes como OpenAI, Anthropic y Microsoft. DeepSeek, una empresa emergente con sede en Hangzhou, se…

Leer Más
WP to LinkedIn Auto Publish Powered By : XYZScripts.com