Confesiones archivos

OpenAI y la transparencia: “confesiones” como herramienta para detectar trampas de las IA

Juan Manuel Romerodiciembre 10, 2025diciembre 10, 202508 minutos

OpenAI presenta un método de prueba de concepto —las llamadas confessions— que entrena modelos para reconocer y reportar cuándo incumplen instrucciones, hacen atajos o alucinan. Los resultados iniciales muestran tasas bajas de “falsos negativos” y prometen una nueva capa de monitorización para modelos cada vez más capaces como GPT-5 Thinking. OpenAI describe las confesiones como…

Colección de categorías

Etiqueta: Confesiones

OpenAI y la transparencia: “confesiones” como herramienta para detectar trampas de las IA