Claude Opus 4.1 archivos

OpenAI presenta GDPval y afirma que GPT-5 ya se mide con humanos en tareas profesionales

Juan Manuel Romeroseptiembre 29, 2025septiembre 30, 202505 minutos

Con el benchmark GDPval, OpenAI muestra que GPT-5-high alcanza paridad o superioridad en 40.6% de 44 ocupaciones evaluadas; la compañía advierte, sin embargo, que la prueba es inicial y limitada. OpenAI dio un paso decidido para cuantificar cuánto se acercan sus modelos al trabajo humano: con GDPval-v0, la compañía evaluó el rendimiento de sus sistemas…

Claude Opus 4.1: la nueva apuesta de Anthropic para liderar la programación con IA

Juan Manuel Romeroagosto 8, 2025agosto 8, 202507 minutos

La última actualización del modelo de inteligencia artificial de Anthropic ya está disponible y promete una mejora significativa en tareas complejas de codificación y razonamiento. Claude Opus 4.1 alcanza un 74,5% en el benchmark SWE-bench Verified y apunta a redefinir los estándares en entornos de desarrollo reales. Anthropic, la empresa emergente en inteligencia artificial que…