Un estudio publicado en Science revela que un modelo de IA iguala o supera a médicos en diagnóstico y triage. El avance abre un nuevo escenario para la medicina, pero los expertos advierten: no reemplaza a los profesionales.
La inteligencia artificial acaba de cruzar un umbral clave en el sector salud. Un estudio liderado por Harvard University, con participación de investigadores de Stanford University, concluyó que un modelo de OpenAI puede igualar e incluso superar el desempeño de médicos humanos en tareas críticas de salas de emergencia.
El trabajo, publicado en la revista Science, evaluó el rendimiento del modelo “o1 preview”, el primero de OpenAI diseñado específicamente para razonar paso a paso. Los resultados fueron contundentes: la IA no solo logró realizar diagnósticos clínicos precisos, sino también recomendar estudios y gestionar casos complejos a niveles comparables —y en algunos casos superiores— a los de médicos experimentados.
Pruebas en condiciones reales: 76 casos en emergencias
El estudio incluyó una evaluación en un entorno clínico real con 76 casos de pacientes en una sala de emergencias de Boston. El modelo fue analizado en tres momentos clave: el triage inicial, el primer contacto con el médico y la admisión hospitalaria o en cuidados intensivos.
Dos médicos evaluadores, sin saber si las decisiones provenían de humanos o de la IA, concluyeron que el modelo igualó o superó el rendimiento humano en todas las etapas. El desempeño fue especialmente destacado en el triage inicial, donde la información disponible es limitada y la capacidad de inferencia resulta crítica.
Ventaja en casos complejos y enfermedades raras
El modelo también mostró una ventaja significativa en diagnósticos complejos y enfermedades poco frecuentes. En particular, se destacó en evaluaciones basadas en casos reales del Massachusetts General Hospital publicados en The New England Journal of Medicine.
“Estos casos son típicamente muy desafiantes”, explicó Arjun Manrai, coautor senior del estudio. “Están llenos de información compleja o engañosa y abarcan múltiples áreas de la medicina”.
Manrai fue más allá: “El rendimiento de la IA en estos casos realmente ha sorprendido a mucha gente”.
Por su parte, Thomas Buckley señaló que el modelo está alcanzando niveles “casi óptimos” en este tipo de pruebas, utilizadas como benchmark desde 1959 para evaluar capacidades diagnósticas.
Más allá del diagnóstico: la IA también gestiona decisiones clínicas
Uno de los hallazgos más relevantes es que la IA no solo diagnostica, sino que también sobresale en lo que los médicos llaman “razonamiento de manejo”: decisiones sobre tratamientos, uso de antibióticos o incluso conversaciones sobre cuidados al final de la vida.
“Este tipo de razonamiento probablemente es más complejo que el diagnóstico”, explicó Peter Brodeur. “Implica factores objetivos y subjetivos, contexto y situaciones. No sorprende que un modelo de razonamiento tenga mejor desempeño que humanos y versiones anteriores de IA como ChatGPT-4”.
Un punto clave: no reemplaza a los médicos
A pesar del impacto de los resultados, los propios investigadores fueron enfáticos en marcar límites.
“Esto no significa que la IA reemplace a los médicos, a pesar de lo que algunas empresas podrían decir”, aclaró Manrai. “Lo que sí muestra es que estamos frente a un cambio profundo que va a transformar la medicina”.
El estudio también señala limitaciones importantes. La evaluación se basó en datos textuales, mientras que la práctica médica real incluye múltiples fuentes de información: imágenes, radiografías, electrocardiogramas y señales fisiológicas.
El futuro: colaboración entre humanos e inteligencia artificial
Para Adam Rodman, coautor del estudio, el mayor potencial está en la colaboración. La IA podría actuar como sistema de triage automatizado o como una segunda opinión para los médicos.
“Podemos imaginar fácilmente un sistema que analice historias clínicas electrónicas y ayude a detectar errores diagnósticos antes de que ocurran”, explicó.
El concepto de segunda opinión ya está en expansión. Un estudio previo de Elsevier en 2025 mostró que el 20% de los médicos consultaban modelos de lenguaje para validar decisiones clínicas, una cifra que probablemente haya crecido desde entonces.
Rodman advierte, sin embargo, sobre un riesgo: “No queremos que empresas intenten eliminar a los médicos del proceso o reducir la supervisión clínica. Estos resultados no respaldan eso”.
Una transformación inevitable
El consenso entre los investigadores es claro: la inteligencia artificial no reemplazará la dimensión humana de la medicina, pero sí redefinirá sus herramientas.
“En última instancia, las personas quieren que otros humanos las guíen en decisiones de vida o muerte”, concluyó Manrai. “Pero ahora contamos con herramientas mucho mejores para ayudarnos”.
El avance de modelos como el de OpenAI marca un punto de inflexión. La pregunta ya no es si la IA será parte del sistema de salud, sino cómo se integrará en uno de los ámbitos más sensibles y complejos de la sociedad.

