OpenAI apuesta por lo “abierto”: lanza gpt-oss, primeros modelos de razonamiento open-weight

Se sacude el tablero de la IA global al liberar dos modelos open-weight —gpt-oss-120b y gpt-oss-20b—, marcando un giro desde su estrategia tradicional. “Queremos que el mundo construya sobre una pila de IA abierta creada en Estados Unidos, basada en valores democráticos”, afirmó Altman, en medio de una creciente presión competitiva de China y demandas regulatorias en EE.UU.

OpenAI, la empresa que revolucionó la IA generativa con ChatGPT, vuelve a sus raíces de apertura: anunció el lanzamiento de dos modelos de razonamiento “open-weight” disponibles para descarga gratuita en la plataforma Hugging Face. Se trata de los modelos gpt-oss-120b y gpt-oss-20b, ambos calificados como “estado del arte” entre alternativas abiertas.

Un cambio de paradigma: de lo cerrado a lo abierto (otra vez)

Esta es la primera vez desde GPT-2 (lanzado hace más de cinco años) que OpenAI libera un modelo abierto. La decisión sorprende porque en los últimos tiempos, la estrategia había sido apostar por el cierre y la monetización vía API, lo que consolidó a OpenAI como líder mundial en servicios empresariales de IA.

Sin embargo, Sam Altman —CEO de OpenAI— reconoció en enero: “Creo que hemos estado en el lado equivocado de la historia respecto al código abierto”.

Hoy la presión viene de varios frentes. China avanza agresivamente con laboratorios como DeepSeek, Alibaba Qwen y Moonshot AI, mientras en Estados Unidos el gobierno de Donald Trump impulsa que las empresas hagan público su software para fortalecer la competitividad nacional.

“Queremos que el mundo construya sobre una pila de IA abierta creada en EE.UU., basada en valores democráticos, disponible gratis para todos y para un beneficio amplio”, puntualizó Altman.

Características y desempeño de los modelos gpt-oss.

  • gpt-oss-120b : Modelo de 117 mil millones de parámetros, capaz de funcionar en una sola GPU Nvidia.
  • gpt-oss-20b : Más liviano, puede correr en portátiles con 16GB de memoria.

Ambos modelos utilizan la arquitectura “mixture-of-experts” (MoE), que activa solo 5,1 mil millones de parámetros por token procesado en la versión mayor. Esto permite eficiencia y versatilidad inéditas en modelos abiertos de su categoría.

  • En la prueba Codeforces , gpt-oss-120b alcanzó 2.622 puntos y gpt-oss-20b, 2.516: superan a alternativas como DeepSeek R1, pero quedan por debajo de los modelos comerciales más avanzados de OpenAI (o3 y o4-mini).
  • En Humanity’s Last Exam (HLE) , lograron 19% y 17,3% respectivamente, situándose igual por encima de los modelos abiertos de Qwen y DeepSeek.

Limitaciones :
A diferencia de los modelos más avanzados de la casa, estos solo procesan texto (no imágenes/audio) y presentan una tasa de “alucinaciones” (errores de razonamiento) superior:

  • gpt-oss-120b “alucinó” en el 49% de las preguntas del benchmark interno PersonQA.
  • gpt-oss-20b, en el 53%.
    Esto representa más del triple de errores que modelos comerciales como o1, aunque se explica por el menor tamaño y la falta de entrenamiento sobre datos propietarios.

Licencia, acceso y debates sobre privacidad

OpenAI libera los modelos bajo licencia Apache 2.0, una de las más permisivas del mercado. Esto permite a cualquier empresa usarlos, modificarlos y monetizarlos sin restricciones ni pagos a OpenAI.
Eso sí, la compañía no publicará los datos de entrenamiento, evitando complicaciones legales por derechos de autor, en contraste con enfoques de laboratorios como AI2.

El entrenamiento de los modelos incluyó técnicas avanzadas de aprendizaje por refuerzo y pruebas extra para comprobar la robustez ante amenazas de uso malicioso. Según OpenAI, sus modelos no alcanzan umbrales peligrosos, ni siquiera tras posibles refinados para ciberataques, aunque sí logran “capacidades biológicas marginales”.

Competencia global, política y ecosistema desarrollador

El contexto no es menor: mientras OpenAI sufre retrasos —por cuestiones de seguridad y regulatorias— en el despliegue de estos modelos, los desarrolladores guardan ansiosos la llegada de DeepSeek R2 y la nueva propuesta open de Meta Superintelligence Lab, en medio de la gran batalla IA entre EE.UU. y China.

Con gpt-oss, OpenAI busca reconquistar la preferencia de la comunidad desarrolladora y alinearse estratégicamente con el discurso político estadounidense, asegurando que la próxima generación de IA, “beneficie a toda la humanidad”.

La guerra de la IA abierta ha comenzado, y OpenAI quiere volver a ser protagonista.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com