Un equipo liderado por Harvard Medical School presenta popEVE, un modelo que puntúa cada variante genética según su probabilidad de causar enfermedad y ya ayudó a diagnosticar cientos de casos difíciles. Identifica prioridades clínicas en genomas completos y ha descubierto 123 genes candidatos hasta ahora no vinculados a trastornos del desarrollo.
Encontrar la variante genética responsable de una enfermedad rara es, a menudo, como buscar una aguja en un pajar: cada genoma humano contiene decenas de miles de alteraciones, pero solo unas pocas son relevantes clínicamente. El nuevo modelo popEVE —desarrollado por el laboratorio de Debora Marks en Harvard Medical School y colaboradores— propone una solución práctica: asignar a cada variante un puntaje comparable a nivel proteoma que indica su probabilidad de causar daño biológico y gravedad clínica. El trabajo fue publicado en Nature Genetics el 24 de noviembre de 2025.
“El objetivo fue desarrollar un modelo que ordene variantes por severidad clínica —proporcionando una vista priorizada y clínicamente significativa del genoma de una persona”, explica Debora Marks, coautora sénior y profesora de Systems Biology en el Blavatnik Institute de HMS. Esa prioridad, subraya el equipo, puede acelerar la ruta desde la secuenciación hasta un diagnóstico útil para el paciente.
Cómo funciona y qué aporta popEVE
popEVE parte de la base del modelo generativo EVE —ya usado para inferir qué posiciones en proteínas son críticas— y agrega dos elementos clave: un modelo tipo large-language para proteínas (que aprende de secuencias de aminoácidos) y datos poblacionales humanos que capturan variación natural. Esa combinación permite calibrar los puntajes para que sean comparables entre genes distintos: es decir, que un valor X para un residuo en la proteína A y un valor X en la proteína B signifiquen propuestas de riesgo clínico equiparables.
En pruebas con variantes documentadas y casos clínicos, popEVE no solo distinguió variantes benignas de patogénicas, sino que también pudo discernir controles sanos de pacientes con trastornos del desarrollo severo, estimar si una variante probablemente provocará muerte en la infancia o en la adultez, e incluso identificar si una alteración era heredada o aparecida de novo sin necesitar siempre datos parentales. Según los autores, el modelo muestra además un desempeño robusto entre distintas ancestrías y evita sobreestimar la prevalencia de variantes patogénicas.
Resultados clínicos: diagnóstico y descubrimiento de genes
El equipo aplicó popEVE a una cohorte amplia de pacientes con trastornos del desarrollo que no tenían diagnóstico previo. Según el comunicado de HMS, el análisis permitió obtener un diagnóstico en aproximadamente un tercio de los casos estudiados, y el modelo encontró variantes en 123 genes no previamente asociados con trastornos del desarrollo —de los cuales 25 fueron confirmados posteriormente por otros laboratorios. Estas cifras ponen de manifiesto tanto la capacidad diagnóstica directa de popEVE como su utilidad para descubrir nuevos blancos biológicos.
Puesta en marcha clínica y colaboraciones
Los autores han habilitado un portal público (pop.evemodel.org) para que clínicos e investigadores puedan consultar puntajes y visualizar salidas del modelo, incluyendo mapas de calor de severidad y estructuras proteicas coloreadas según riesgo. Además, ya existen colaboraciones con instituciones como el Children’s Rare Disease Collaborative en Boston Children’s Hospital, la División de Genética Humana del Children’s Hospital of Philadelphia y Genomics England junto con el Wellcome Sanger Institute para validar y aplicar popEVE en entornos reales de diagnóstico.
Rose Orenbuch, primera autora, resume el enfoque: “Necesitábamos una forma de comparar variantes entre genes para ayudar al clínico a priorizar —y popEVE ya ha encontrado numerosos candidatos génicos donde métodos previos fallaron”. Orenbuch enfatiza que el valor real es acelerar diagnósticos en pacientes que llevan años sin respuesta y permitir buscar fuera de los genes ya conocidos.
Límites, verificaciones y futuro
Los autores admiten que popEVE requiere verificación y validación continuas antes de su adopción clínica masiva, y que los puntajes deben integrarse con evidencia clínica y genética adicional. No obstante, el modelo ya se está integrando en bases de datos de variantes y proteínas como ProtVar y UniProt, lo que facilitará su uso internacional por la comunidad científica. A largo plazo, además de mejorar diagnósticos, popEVE podría acelerar la identificación de nuevos blancos farmacológicos para enfermedades genéticas.
Por qué importa para la industria y la salud pública
popEVE representa un ejemplo de cómo la IA entrenada con datos evolutivos y poblacionales puede aportar herramientas accionables en medicina genética: reduce el tiempo de revisión de variantes, aumenta la tasa de diagnóstico en cohortes difíciles y ofrece rutas para descubrimientos terapéuticos. Para hospitales, laboratorios clínicos y empresas de diagnóstico genómico, la llegada de popEVE abre tanto oportunidades (mejor triage de variantes, servicios de interpretación) como responsabilidades regulatorias y éticas (validación, equidad y manejo de datos).

