OpenAI y Google DeepMind arrasan en el ICPC 2025: los LLMs superan altos retos algorítmicos

GPT-5 logra un 12/12 perfecto y Gemini 2.5 Deep Think resuelve 10/12 en la final mundial del ICPC; el episodio demuestra que las herramientas de IA empresarial ya pueden afrontar problemas algorítmicos inéditos.

En una escena que mezcla orgullo académico y asombro tecnológico, OpenAI y Google DeepMind exhibieron en la Final Mundial del ICPC 2025 que sus modelos de lenguaje avanzados —GPT-5 y Gemini 2.5 Deep Think— son capaces de resolver problemas algorítmicos complejos al nivel de las mejores universidades del planeta.

Según las organizaciones, GPT-5 alcanzó una puntuación perfecta con 12 de 12 problemas resueltos dentro de la ventana de 5 horas que define la competencia. En paralelo, Gemini 2.5 Deep Think resolvió 10 de 12 problemas en 677 minutos, desempeño que Google indicó lo ubicaría segundo en la clasificación. Ninguno de los equipos humanos llegó al 12/12; los ganadores humanos de oro fueron equipos de St. Petersburg State University, University of Tokyo, Beijing Jiaotong University y Tsinghua University.

Desde OpenAI explicaron que “we officially competed in the onsite AI track of the ICPC, with the same 5-hour time limit to solve all twelve problems… For 11 of the 12 problems, the system’s first answer was correct. For the hardest problem, it succeeded on the 9th submission.”

Google, por su parte, destacó que Gemini resolvió un desafío que ningún equipo humano pudo descifrar y detalló que “Gemini found an effective solution with a clever insight: it first assumed each reservoir has a ‘priority value’… Leveraging the relationship between priority values and optimal flows, Gemini used nested ternary searches to quickly find optimal priority values…”.

El certamen congregó a 139 universidades de al menos 103 países, y la dinámica habitual exige no solo corrección, sino rapidez: la clasificación final depende de cuántas preguntas se resuelven y en qué tiempo. En ese contexto, la performance de los LLMs pone en evidencia una nueva realidad: los modelos de base no solo generan texto coherente, sino que alcanzan —y a veces superan— habilidades de razonamiento matemático y algorítmico complejas.

¿Qué significa esto para empresas y equipos técnicos? Primero, demuestra que herramientas como GPT-5 y Gemini pueden ser aliadas potentes en tareas de diseño algorítmico, optimización y resolución de problemas inéditos, acelerando prototipos y elevando el techo del análisis automático. Segundo, subraya la necesidad de supervisión experta: si bien los modelos resuelven, sus rutas de razonamiento pueden requerir verificación, pruebas de robustez y garantías de ausencia de errores críticos.

Finalmente, el episodio alimenta el debate sobre el camino hacia la inteligencia general. Para muchos observadores, resultados como estos son señales de progreso sustantivo en razonamiento profundo. Para ejecutivos, la lección inmediata es práctica: integrar estos modelos en flujos de I+D y resolución de problemas complejos puede ofrecer ventaja competitiva —siempre con controles humanos, métricas de calidad y gobernanza que aseguren resultados confiables.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com