
Anthropic y OpenAI: qué reveló el piloto de evaluaciones de alineamiento sobre los modelos de GPT-4
En un ejercicio conjunto realizado en junio y julio de 2025, Anthropic y OpenAI se auditaron mutuamente con pruebas internas de alineación. El foco no estuvo en la probabilidad real de que esos contextos ocurran, sino en las propensiones de los modelos. Para OpenAI se testearon GPT-4o, GPT-4.1, o3 y o4-mini; para comparar, los Claude…