La start-up respaldada por Eric Schmidt presentó un modelo de razonamiento especializado en química que supera a los sistemas más avanzados en tareas científicas complejas.
FutureHouse, la innovadora start-up de San Francisco fundada en 2023 con el respaldo del ex CEO de Google, Eric Schmidt, dio un paso clave en la automatización de la ciencia. La compañía presentó ether0, su primer “modelo de razonamiento” entrenado específicamente para tareas científicas, que ya demuestra un rendimiento sobresaliente en química.
A diferencia de los grandes modelos de lenguaje (LLM) tradicionales, ether0 no solo genera respuestas, sino que “piensa en voz alta”, mostrando de manera transparente su proceso de razonamiento. “La gran oportunidad de estos modelos es que podemos ver qué están pensando durante todo el proceso”, explicó Sam Rodriques, fundador de FutureHouse.
Este desarrollo se suma a una tendencia creciente en el uso de IA para acelerar la investigación científica. Empresas como Google o Sakana AI también están explorando este camino, pero FutureHouse logró un diferencial importante: su modelo no solo responde preguntas de manual, sino que es capaz de generar nuevos conocimientos en química, un hito que ningún modelo había alcanzado hasta ahora.
Un modelo que aprende razonando
El equipo de FutureHouse partió de un modelo base pequeño desarrollado por la start-up francesa Mistral AI —25 veces más compacto que DeepSeek-R1—, lo que permite que ether0 funcione incluso en una laptop. En lugar de entrenarlo con textos académicos, decidieron que aprendiera resolviendo pruebas.
Andrew White, ingeniero químico de FutureHouse, recopiló resultados de laboratorio de 45 artículos científicos y los transformó en 577.790 preguntas verificables. Además, el modelo fue entrenado para “pensar en voz alta” leyendo soluciones erróneas y cadenas de razonamiento generadas por DeepSeek-R1.
Tras múltiples iteraciones y la combinación de varios modelos especializados, surgió ether0, que fue evaluado con nuevas preguntas, muchas de ellas inéditas. Los resultados fueron contundentes: ether0 superó a modelos de punta como GPT-4.1 de OpenAI y DeepSeek-R1 en casi todas las pruebas. En algunos tipos de problemas, su precisión fue más del doble que la de sus competidores. Y todo con un costo sorprendentemente bajo: entrenar un modelo tradicional comparable habría requerido 50 veces más datos.
Un impacto real en el laboratorio
La comunidad científica observa estos avances con entusiasmo y cautela. Kevin Jablonka, químico digital de la Universidad de Jena en Alemania, destacó: “Es impresionante. Los modelos anteriores no podían hacer esto”. Jablonka comprobó que ether0 podía inferir correctamente propiedades moleculares que no había visto durante el entrenamiento, como ajustar la fórmula de una molécula para que encajara en un espectro de resonancia magnética nuclear. “No me lo esperaba”, afirmó.
El potencial de este tipo de modelos va mucho más allá de la teoría. FutureHouse ya ha utilizado sus agentes de IA —herramientas basadas en LLM— para proponer un nuevo tratamiento para la degeneración macular seca relacionada con la edad, una de las principales causas de ceguera.
Sin embargo, todavía existen limitaciones. Como señaló Jablonka, ether0 genera soluciones en forma de fórmulas y reacciones moleculares, lo que dificulta la comparación directa con otros modelos o con el desempeño humano en pruebas independientes.
Por otro lado, el equipo de FutureHouse descubrió que al permitir que el modelo razonara durante más tiempo, las respuestas se volvían más precisas, pero también menos comprensibles, mezclando idiomas e inventando palabras. Por eso, priorizaron la interpretabilidad limitando el tiempo de razonamiento.
Hacia una IA científica autónoma
El sueño de FutureHouse es ambicioso: construir un “científico de IA” capaz de gestionar todo el ciclo de investigación, desde la generación de hipótesis hasta la redacción de artículos. Ether0 es un paso significativo en esa dirección.
Como afirmó Rodriques: “Los modelos de razonamiento podrían ser útiles para generar nuevas ideas de investigación”. Si estos avances continúan, no es descabellado imaginar un futuro en el que laboratorios robotizados, impulsados por modelos como ether0, automaticen por completo partes clave del proceso científico.
Por ahora, ether0 ya está disponible en código abierto, lo que permitirá a la comunidad explorar sus capacidades y contribuir a su evolución. Con el respaldo financiero y estratégico de Eric Schmidt y un equipo comprometido, FutureHouse se posiciona como uno de los actores más prometedores en la intersección entre inteligencia artificial y ciencia.