World Labs y la visión de Fei-Fei Li: por qué la IA está incompleta sin inteligencia espacial

La científica detrás de ImageNet impulsa una nueva frontera de la inteligencia artificial con modelos capaces de crear mundos tridimensionales. Desde robótica hasta videojuegos, World Labs busca “potenciar” la creatividad humana con una tecnología que va más allá del lenguaje.

Fei-Fei Li no necesita presentación en el mundo de la inteligencia artificial. Profesora en la Universidad de Stanford, científica en computación y creadora de ImageNet —la base de datos lanzada hace casi dos décadas que sentó las bases de la visión por computadora moderna—, es considerada una de las voces más influyentes del sector y ampliamente reconocida como la “madrina de la inteligencia artificial”.

Hoy, Li está enfocada en una nueva misión, esta vez como fundadora de una start-up. Su empresa, World Labs, apunta a desarrollar lo que denomina inteligencia espacial, una dimensión de la IA que, según su visión, es indispensable para que esta tecnología esté verdaderamente completa. El objetivo es ambicioso: construir modelos capaces de entender, generar e interactuar con el mundo físico a través de representaciones tridimensionales.

“Para mí, la inteligencia artificial no estaría completa si no tuviera el alcance, la profundidad y la capacidad de inteligencia espacial que tienen los humanos”, explica Li en diálogo con Cristina Criddle, corresponsal de tecnología del Financial Times.

Marble y los modelos que crean mundos en 3D

El primer gran producto de World Labs es Marble, un modelo presentado en noviembre que permite a los usuarios crear mundos tridimensionales a partir de una foto, un video corto o incluso desde cero, imaginando escenarios completamente nuevos. A diferencia de los grandes modelos de lenguaje, que procesan texto, los llamados “world models” están diseñados para generar espacios en tres dimensiones.

“Marble es el primer producto que se enfoca en permitir a los usuarios crear mundos 3D increíbles, ya sea elevando el mundo real a partir de una foto o un pequeño video, o creando un mundo imaginario”, detalla Li. El énfasis, aclara, está en un enfoque “model-first”: el producto es la puerta de entrada para que los usuarios interactúen directamente con el modelo subyacente.

Para la fundadora de World Labs, el aprendizaje clave vendrá del uso real. “Creo profundamente que la creatividad humana no puede ser reemplazada. Puede ser potenciada”, afirma. “Espero que Marble sea una colaboración que potencie a creadores, diseñadores y desarrolladores”.

De efectos visuales a robótica: una tecnología transversal

Uno de los aspectos más relevantes de Marble es su carácter horizontal. Según Li, las aplicaciones de los modelos de mundos son amplias y atraviesan múltiples industrias. Un caso concreto es el de los efectos visuales (VFX), donde Marble permite previsualizar ideas, diseñar sets virtuales y trabajar en producciones cinematográficas con una velocidad inédita.

“Puede darte un espacio 3D, generar videos con control preciso del color dentro de ese espacio y exportar el contenido en distintos formatos para integrarlo en los flujos de trabajo”, explica. También arquitectos y diseñadores de interiores utilizan Marble para visualizar y recorrer sus ideas, casi como si se tratara de un “viaje por la mente”.

La robótica es otro de los campos clave. World Labs ya observa desarrolladores que emplean Marble para simular entornos de entrenamiento, tanto para tareas de navegación como de manipulación de objetos. En el mundo de los videojuegos, el modelo permite descargar mundos y mallas listas para construir mecánicas de juego, facilitando el trabajo de los estudios.

Incluso investigadores en psicología y salud están explorando Marble como entorno inmersivo para estudiar el comportamiento humano y condiciones clínicas. En todos los casos, hay un denominador común. “Cada caso de uso que hemos visto hasta ahora tiene un tema unificador: ahorra tiempo”, resume Li.

Creatividad, tiempo y disrupción en gaming

El ahorro de tiempo abre un debate más amplio sobre el impacto de la IA en el trabajo creativo. Para Li, la pregunta no es si se perderán empleos, sino qué se hace con ese tiempo ganado. “Depende de si creés que la creatividad es limitada o ilimitada. Yo creo que la creatividad humana es ilimitada”, sostiene.

Como ejemplo, menciona el trabajo conjunto con Sony Studio en un video de Marble. Según los artistas y desarrolladores involucrados, la herramienta les permitió experimentar con muchas más ideas que en un proceso tradicional. En la industria de VFX, un profesional llegó a afirmar que Marble aceleró la ideación y el desarrollo en un factor de 40 veces.

En el terreno del gaming, Li anticipa una disrupción más profunda. “Los motores de simulación y los motores de juegos necesitan mejoras para hacerles la vida más fácil a los desarrolladores”, afirma. En su visión, los videojuegos se están fusionando con educación, experiencias y productividad, en una tendencia conocida como transmedia, que se apoya cada vez más en herramientas de inteligencia artificial generativa.

Qué distingue a World Labs en la carrera por los world models

La competencia en modelos de mundos se intensifica. Google, Runway y xAI, entre otros, también exploran este camino. Sin embargo, Li remarca un diferencial clave. “Somos la primera compañía que, hace dos años, se dedicó exclusivamente a la inteligencia espacial”, asegura.

Para ella, los grandes modelos de lenguaje representan la inteligencia lingüística, mientras que los world models apuntan a la inteligencia espacial: la capacidad cognitiva que permite a humanos, animales, avatares o robots entender, razonar, crear e interactuar con el mundo. “Esa es nuestra Estrella del Norte”, define.

Lejos de plantear una competencia excluyente, Li ve el futuro de la IA como una orquesta de inteligencias múltiples, en línea con las teorías de Howard Gardner. Lenguaje, espacio, matemática y emoción conviviendo en un mismo sistema.

Robótica, datos y una visión centrada en las personas

En robótica, Li es cauta. Considera que el sector aún está lejos de resolverse y que el gran desafío sigue siendo el de los datos. La combinación de datos reales, datos operados por humanos y datos sintéticos generados en simulaciones es, según ella, fundamental. En ese contexto, los entornos virtuales y la inteligencia espacial cumplen un rol estratégico.

¿Es esto un paso hacia la superinteligencia? Li evita el término y pone el foco en el propósito. “Nuestra Estrella del Norte es una inteligencia que sea benévola para las personas. No me importa cómo la llamen. La inteligencia artificial, como cualquier herramienta, debe estar al servicio de la humanidad”.

Con World Labs y Marble, Fei-Fei Li no solo propone una nueva capa tecnológica, sino también una redefinición de lo que significa avanzar en inteligencia artificial: no solo entender palabras, sino comprender y crear mundos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com