Un estudio realizado en más de 39.000 consultas médicas mostró que el copiloto de inteligencia artificial basado en GPT‑4o redujo los errores diagnósticos y de tratamiento. El modelo podría marcar un antes y un después en la atención primaria global.
La inteligencia artificial comienza a demostrar su impacto en entornos clínicos reales. OpenAI y la empresa social Penda Health, que opera 16 clínicas en Nairobi, Kenia, llevaron a cabo un estudio pionero sobre el uso de un copiloto clínico basado en IA, que arrojó resultados contundentes: los errores diagnósticos se redujeron un 16% y los errores de tratamiento un 13% entre los profesionales que utilizaron la herramienta, en comparación con quienes no lo hicieron.
El copiloto, llamado AI Consult, fue desarrollado con el modelo GPT‑4o e integrado directamente en el flujo de trabajo de los médicos. La herramienta no reemplaza decisiones clínicas, sino que actúa como un sistema de alerta en tiempo real que identifica posibles errores durante la atención y emite recomendaciones. «Siempre que estos agentes de IA puedan mejorar la calidad de la atención sin interrumpirla, su implementación tiene sentido», explicó el equipo de OpenAI en la presentación de los resultados.
Tecnología al servicio de la prevención
La investigación incluyó 39.849 visitas de pacientes en 15 clínicas distintas y fue avalada por diversas instituciones sanitarias de Kenia, incluyendo el Ministerio de Salud y la AMREF Health Africa. Cada clínica de Penda Health brinda atención primaria, urgencias, laboratorio y farmacia, y atiende cerca de 500.000 pacientes al año. La IA fue entrenada considerando el contexto epidemiológico local, las guías clínicas nacionales y los protocolos propios de Penda.
El sistema funciona integrado al historial clínico electrónico. Cuando se detecta un posible problema, emite alertas codificadas por color:
- Verde: sin observaciones.
- Amarillo: advertencia moderada, que el médico puede revisar si lo desea.
- Rojo: posible problema crítico que requiere atención obligatoria.
«Nuestro copiloto no toma decisiones por los médicos. Les permite ver lo que podría haberse pasado por alto, sin intervenir de manera intrusiva», explicó Robert Korom, director médico de Penda Health. Esta segunda versión del copiloto —más integrada y automatizada— logró una adopción mucho más amplia que los prototipos anteriores, donde el profesional debía solicitar asistencia de forma manual.
Cierre de brechas entre potencial y práctica
Uno de los principales obstáculos para la adopción de la IA en salud es la brecha entre las capacidades de los modelos y su aplicación práctica. Este estudio muestra cómo una implementación clínica cuidadosamente diseñada, con formación al personal y adaptación al contexto, puede superar ese escollo. “El rendimiento del modelo ya no es el factor limitante”, destacaron desde OpenAI. “El verdadero desafío está en cómo se integra la tecnología en la práctica médica”.
Según la Organización Mundial de la Salud, los errores médicos en atención primaria son comunes y prevenibles. En este contexto, herramientas como AI Consult podrían tener un efecto global significativo si se escalan adecuadamente. El trabajo conjunto de OpenAI y Penda no solo aporta evidencia científica concreta, sino que también sienta un precedente para futuras implementaciones responsables de IA en salud, especialmente en países con recursos limitados.
Mientras los grandes modelos de lenguaje siguen mejorando —GPT‑4o ya duplicó el rendimiento en benchmarks médicos respecto a su versión anterior—, el verdadero salto parece estar en el diseño centrado en el usuario. Y en este caso, el usuario es el médico… y el beneficiado, el paciente.