La startup biotecnológica Profluent presenta ProGen3, una familia de modelos de lenguaje generativo entrenados en más de 3.400 millones de secuencias proteicas, prometiendo revolucionar el diseño de proteínas para aplicaciones médicas e industriales.
En un movimiento que podría redefinir el panorama de la biotecnología, Profluent, la empresa con sede en Berkeley especializada en diseño de proteínas mediante inteligencia artificial, ha anunciado el lanzamiento de ProGen3.
Este conjunto de modelos de lenguaje generativo, entrenados en una vasta base de datos de secuencias proteicas, busca acelerar y optimizar la creación de proteínas funcionales para diversas aplicaciones, desde terapias médicas hasta soluciones industriales.

Escalando la inteligencia artificial para comprender la biología
ProGen3 representa un avance significativo en la aplicación de modelos de lenguaje a la biología. Entrenado en el Profluent Protein Atlas v1 (PPA-1), que contiene 3.400 millones de secuencias de proteínas completas y 1,1 billones de tokens de aminoácidos, ProGen3 ha sido escalado hasta un modelo de 46.000 millones de parámetros entrenado en 1,5 billones de tokens.
Este enfoque ha permitido generar proteínas con una diversidad y funcionalidad comparables, e incluso superiores, a las naturales.
Según Profluent, «los modelos más grandes como ProGen3-46B generaron proteínas de familias que los modelos más pequeños no conocían, pero no viceversa». Además, «ProGen3-46B generó un 59% más de diversidad que ProGen3-3B y un 198% más que ProGen3-339M», lo que indica que a medida que los modelos crecen, representan más fielmente los principios biológicos subyacentes a una mayor diversidad de la vida.
Aplicaciones prácticas y colaboraciones estratégicas
ProGen3 no es solo un avance académico; tiene aplicaciones prácticas inmediatas. La plataforma permite el diseño de anticuerpos específicos, denominados OpenAntibodies, para 20 objetivos terapéuticos que afectan a 7 millones de pacientes y representan U$S 660 mil millones en ventas históricas.
Además, ProGen3 ha facilitado el desarrollo de un editor génico ultra-compacto, ampliando las posibilidades en la edición genética de próxima generación.
Profluent ofrece a sus socios la posibilidad de licenciar estos activos moleculares, colaborar en el diseño de nuevas proteínas o acceder anticipadamente a su API, fomentando un ecosistema de innovación abierta en el diseño de proteínas.
Financiamiento y respaldo de líderes en tecnología
Desde su fundación en 2022 por Ali Madani y Alexander Meeske, Profluent ha recaudado un total de U$S 44 millones en financiamiento. La ronda más reciente, de U$S 35 millones, fue liderada por Spark Capital, con la participación de inversores destacados como Insight Partners, Air Street Capital y figuras prominentes de OpenAI, Salesforce, Octant Bio y Google, incluyendo a Jeff Dean, científico jefe de Google DeepMind.
Ali Madani, CEO de Profluent, expresó: «Nuestra investigación en la vanguardia de la IA ha permitido a Profluent crear modelos de lenguaje que comienzan a aprender el plano de la naturaleza. Estamos moviendo la biología de estar limitada por lo que se puede descubrir en la naturaleza a poder diseñar precisamente según nuestras necesidades a través de la IA. La ciencia es real y el momento es ahora para crear proactivamente medicamentos innovadores que puedan transformar la sociedad».
Un futuro prometedor en la intersección de la IA y la biología
Con ProGen3, Profluent demuestra que la inteligencia artificial puede ser una herramienta poderosa para comprender y diseñar la complejidad de la vida a nivel molecular.
Al combinar modelos de lenguaje de gran escala con datos biológicos extensos, la empresa está allanando el camino hacia una nueva era en la que la biología es programable y el diseño de proteínas es más rápido, preciso y accesible que nunca.
Para más información sobre ProGen3 y oportunidades de colaboración, visite el sitio oficial de Profluent.