
OpenAI presenta GDPval y afirma que GPT-5 ya se mide con humanos en tareas profesionales
Con el benchmark GDPval, OpenAI muestra que GPT-5-high alcanza paridad o superioridad en 40.6% de 44 ocupaciones evaluadas; la compañía advierte, sin embargo, que la prueba es inicial y limitada. OpenAI dio un paso decidido para cuantificar cuánto se acercan sus modelos al trabajo humano: con GDPval-v0, la compañía evaluó el rendimiento de sus sistemas…