Biohub apuesta a transformar la biología con una IA capaz de diseñar proteínas en días

La inteligencia artificial ya revolucionó la generación de texto, imágenes y software. Ahora, empieza a avanzar sobre uno de los territorios más complejos de la ciencia: la biología molecular.

La organización Biohub anunció el lanzamiento de una nueva generación de modelos de IA denominada Evolutionary Scale Models (ESM), un sistema que busca comprender, mapear y diseñar proteínas a escala global.

La iniciativa incluye tres desarrollos principales: ESMFold2, un modelo de predicción estructural de proteínas; ESM Atlas, un mapa con 6.800 millones de secuencias y 1.100 millones de estructuras predichas; y ESMC, un modelo de lenguaje entrenado sobre aproximadamente 2.800 millones de secuencias biológicas.

El objetivo es ambicioso: construir una especie de “modelo mundial” de la biología de proteínas, capaz no sólo de analizar estructuras existentes, sino también de diseñar nuevas moléculas con potencial terapéutico.

Una IA entrenada con la evolución de toda la vida

El proyecto parte de una hipótesis científica central: si un modelo de lenguaje se entrena con secuencias de proteínas provenientes de toda la evolución biológica, podría aprender las reglas fundamentales que gobiernan cómo las proteínas se pliegan, interactúan y funcionan.

Las proteínas están formadas por cadenas de aminoácidos y son responsables de casi todos los procesos esenciales de los organismos vivos. Desde la reparación celular hasta la transmisión de señales o la defensa frente a infecciones, su funcionamiento define buena parte de la biología.

Biohub explicó que ESMC fue entrenado para predecir aminoácidos faltantes dentro de secuencias proteicas, una metodología similar a la utilizada por modelos de lenguaje generativo. Sin embargo, durante ese proceso el sistema comenzó a desarrollar representaciones internas capaces de inferir estructura y función biológica sin haber sido entrenado explícitamente para ello.

Según la organización, el nuevo modelo lleva el escalado computacional a un nivel muy superior respecto de versiones anteriores, al entrenarse con miles de millones de secuencias en lugar de millones.

Diseñar anticuerpos con inteligencia artificial

Uno de los puntos más destacados del anuncio es la capacidad de ESMFold2 para diseñar proteínas funcionales en forma computacional.

Biohub aseguró que el sistema logró crear proteínas capaces de unirse a objetivos moleculares vinculados con oncología e inmunología, incluyendo EGFR, PD-L1, CTLA-4, PDGFRβ y CD45, todos ellos asociados a distintos tipos de cáncer y procesos inmunológicos.

Entre los resultados más relevantes, el modelo diseñó un anticuerpo de cadena simple contra PD-L1 con una afinidad medida de 4,3 nM, un nivel considerado terapéicamente relevante. Además, en ensayos celulares logró bloquear la supresión de señales inmunológicas mediadas por PD-1/PD-L1.

La compañía explicó que tradicionalmente encontrar proteínas o anticuerpos funcionales podía demandar meses o incluso años de trabajo experimental. Con este enfoque, gran parte de la búsqueda inicial puede realizarse de manera virtual en pocos días.

“Cuando las representaciones digitales de la biología alcanzan suficiente precisión, los diseños de proteínas pueden probarse computacionalmente antes de llegar al laboratorio”, sostuvo Biohub en la presentación.

Más rápido que los métodos tradicionales

El nuevo sistema también apunta a resolver otro desafío histórico: la predicción de estructuras proteicas complejas.

Según Biohub, ESMFold2 alcanzó resultados de “estado del arte” en benchmarks de predicción estructural, especialmente en complejos anticuerpo-antígeno, considerados entre los problemas más difíciles y relevantes para el desarrollo de terapias.

El modelo puede predecir la estructura de una proteína de longitud 1024 en apenas 9,4 segundos mediante su variante ESMFold2-Fast. Esa velocidad cambia radicalmente la escala posible de experimentación.

“Cada candidato de diseño se convierte en un experimento virtual y cientos de miles pueden ejecutarse en un día”, señaló la organización.

Además, Biohub confirmó que utilizó microscopía crioelectrónica para validar experimentalmente uno de los diseños generados por IA: un minibinder dirigido contra EGFR. Los resultados mostraron una coincidencia extremadamente alta entre la estructura predicha y la observada en laboratorio, con apenas 1,204 Å RMSD de diferencia.

Un mapa gigante de proteínas

Otro de los anuncios clave fue ESM Atlas, una gigantesca base de datos que organiza 6.800 millones de secuencias y 1.100 millones de estructuras predichas.

La plataforma busca ayudar a investigadores a encontrar relaciones biológicas que hasta ahora permanecían ocultas, incluso entre proteínas con muy baja similitud evolutiva.

Según Biohub, el sistema logró identificar conexiones funcionales en mecanismos CRISPR y proteínas Fanzor sin haber recibido entrenamiento específico sobre edición genética.

“La organización de este espacio de representación crea un puente entre la biología conocida y la desconocida”, explicaron los investigadores.

NVIDIA y Amazon, entre los socios tecnológicos

El entrenamiento de los modelos utilizó tecnologías de NVIDIA, incluyendo TransformerEngine y kernels cuEquivariance optimizados para acelerar inferencia y procesamiento paralelo.

Además, Biohub anunció alianzas con múltiples plataformas tecnológicas y científicas para distribuir el sistema, entre ellas AWS Bio Discovery, Benchling AI, Modal, SandboxAQ y Tool Universe.

Todos los modelos fueron liberados bajo licencia MIT y ya están disponibles públicamente en la plataforma Biohub.

El anuncio llega en un momento donde la convergencia entre inteligencia artificial y biotecnología empieza a captar cada vez más inversiones. Después de la revolución iniciada por AlphaFold en predicción de proteínas, las nuevas plataformas buscan avanzar un paso más allá: pasar de comprender la biología a diseñarla activamente mediante IA.

Y eso podría redefinir desde el descubrimiento de medicamentos hasta el desarrollo de terapias personalizadas para enfermedades raras y cáncer.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com