Meta impulsa V‑JEPA 2: un modelo de “world reasoning” para que la IA piense antes de actuar

La compañía lanza V‑JEPA 2, un modelo de 1.200 millones de parámetros que aprende de más de un millón de horas de video, y presenta tres benchmarks para evaluar cómo la IA entiende, predice y planifica acciones en entornos reales.

Meta Research acaba de dar un paso significativo en la evolución de la inteligencia artificial con V‑JEPA 2, su nuevo “world model” entrenado con más de 1,2 mil millones de parámetros.

Utilizando más de un millón de horas de video sin etiquetar y un entrenamiento adicional con datos de robots, el sistema está diseñado para dotar a los agentes de IA de una capacidad inédita: razonar, prever y planificar acciones antes de actuar en entornos físicos.

De ver a pensar

A diferencia de los modelos tradicionales que dependen de datos etiquetados o el procesamiento de texto e imagen, V‑JEPA 2 aprende de la observación intensa. Meta describió: “Como los humanos, tenemos la capacidad de predecir cómo evolucionará el mundo físico en respuesta a nuestras acciones. V‑JEPA 2 ayuda a los agentes de IA a imitar esa inteligencia”.

Esta aproximación le permite a la IA anticiparse a sucesos como la trayectoria de una pelota o cómo esquivar obstáculos.

Entrenamiento en dos fases

El modelo se entrenó en dos etapas. Primero, se expuso a vídeo sin acción para comprender patrones de movimiento y dinámica del mundo. Luego, se incorporaron cerca de 62 horas de datos de interacciones robóticas (grabaciones de robots manipulando objetos), permitiéndole anticipar resultados según distintas acciones.

Esta metodología resultó en tasas de éxito de entre 65 % y 80 % en tareas de “pick-and-place” con objetos desconocidos.

Tres nuevos benchmarks para medir inteligencia física

Para que la comunidad científica evalúe estos avances, Meta liberó tres benchmarks orientados a razonamiento físico en video:

  1. IntPhys 2: detección de eventos físicamente imposibles.
  2. MVPBench: respuesta a preguntas sobre video con mínimos cambios.
  3. CausalVQA: comprensión de causa‑efecto y planificación.

Estas herramientas estandarizan la evaluación de modelos de “world reasoning” y aceleran el progreso colaborativo.

Casos de uso y futuro de la IA física

Meta probó V‑JEPA 2 en sus laboratorios con robots que, usando solo visión, consiguieron realizar tareas complejas: identificar, tomar y colocar objetos en entornos nuevos, sin entrenamiento específico previo.

Los expertos destacan el impacto más allá de la robótica: la capacidad de “anticiparse y adaptarse” será clave también para asistentes inteligentes en interacción con seres humanos, según David Eberle, CEO de Typewise.

Democratización y próxima escala

V‑JEPA 2 y sus benchmarks ya están disponibles como open source, con pesos modelo, código y datos publicados en GitHub y Hugging Face. Además, Meta lanzó un leaderboard para impulsar la investigación colaborativa.

Este paso refuerza un enfoque estratégico en IA física, donde los agentes no solo reaccionan, sino que “piensan antes de actuar”, acercando a la tecnología al concepto de Inteligencia de Máquina Avanzada (AMI), tal como lo definen desde Meta

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com