Invezz

Meta presenta V-JEPA 2: un modelo de IA predice el movimiento del mundo real sin datos de video

Meta presenta V-JEPA 2: un modelo de IA predice el movimiento del mundo real sin datos de video
Diya Poddar
11 jun 2025, 18:50 P. M.
  • Meta lanzó V-JEPA 2, un "modelo mundial" que aprende de videos sin etiquetar para la comprensión espacial en tiempo real.
  • Meta está invirtiendo 14.000 millones de dólares en Scale AI, lo que supone un gran impulso hacia la IA y la robótica para sus ofertas principales.
  • El lanzamiento de código abierto de V-JEPA 2 intensifica la competencia en el espacio de la IA "modelo mundial".

Meta ha lanzado un nuevo sistema de inteligencia artificial llamado V-JEPA 2, destinado a transformar la forma en que las máquinas entienden y navegan por el mundo físico.

El modelo de código abierto, revelado el miércoles en la conferencia VivaTech en París, imita el razonamiento humano para anticipar resultados físicos, como una pelota que se cae de una mesa o un objeto que permanece presente cuando está fuera de la vista.

A diferencia de los modelos tradicionales que se basan en imágenes o videos anotados, V-JEPA 2 utiliza un "espacio latente" para simular la dinámica del mundo real, lo que marca un cambio de la IA basada en el lenguaje a sistemas más conscientes del espacio.

Un nuevo avance de IA simula un razonamiento similar al humano en tiempo real

El modelo V-JEPA 2 representa el último avance de Meta en sistemas de IA conocidos como "modelos mundiales", un concepto que está ganando adeptos entre los desarrolladores que buscan ir más allá de los grandes modelos de lenguaje.

Estos sistemas intentan construir simulaciones internas de la realidad que ayudan a las máquinas a predecir resultados y planificar acciones en consecuencia.

Según Meta, V-JEPA 2 puede realizar este razonamiento sin necesidad de secuencias de vídeo etiquetadas, lo que lo diferencia de los sistemas de IA generativa existentes como ChatGPT o Gemini.

El modelo está diseñado para permitir la comprensión espacial en tiempo real de tecnologías impulsadas por IA, como vehículos autónomos, robots de almacén y sistemas de entrega con drones.

En una presentación en video, el científico jefe de IA de Meta, Yann LeCun, describió V-JEPA 2 como un "gemelo digital abstracto de la realidad" que permite a la IA "predecir las consecuencias de sus acciones" y "planificar un curso de acción para realizar una tarea determinada".

Meta amplía su enfoque en IA con una inversión de 14.000 millones de dólares en IA a escala

El lanzamiento de V-JEPA 2 por parte de Meta se produce en un momento en el que la empresa está redoblando sus ambiciones de IA.

Según los informes, el gigante tecnológico está invirtiendo $ 14 mil millones en Scale AI, una startup con sede en San Francisco que suministra datos de entrenamiento para el aprendizaje automático.

Se espera que la empresa, fundada por Alexandr Wang, desempeñe un papel clave en la próxima fase de desarrollo de la IA de Meta.

Según personas familiarizadas con el asunto, Wang también está siendo contratado para liderar iniciativas clave de IA en Meta.

Esta inversión se alinea con el objetivo declarado del CEO Mark Zuckerberg de incorporar la IA en las ofertas principales de Meta.

La compañía no solo busca mejorar la experiencia de usuario de Facebook e Instagram a través de la IA, sino también desarrollar capacidades a largo plazo en robótica y sistemas autónomos.

La competencia se calienta entre los desarrolladores de modelos mundiales

Los esfuerzos de Meta siguen una tendencia creciente en la investigación de IA hacia el modelado mundial.

En septiembre del año pasado, el investigador de IA Fei-Fei Li recaudó 230 millones de dólares para una startup llamada World Labs, que también se centra en la construcción de modelos mundiales a gran escala.

Mientras tanto, la unidad DeepMind de Google está probando su propio proyecto de modelo mundial llamado Genie, diseñado para simular juegos y entornos virtuales en tiempo real.

A diferencia de los grandes modelos lingüísticos que interpretan y generan texto, los modelos del mundo priorizan la comprensión espacial, el razonamiento causal y la predicción.

Estos modelos podrían llegar a ser esenciales para cualquier IA que opere en entornos dinámicos del mundo real, desde bots de entrega hasta sistemas de automatización de fábricas.

Cómo V-JEPA 2 podría remodelar las aplicaciones de IA

Meta ha hecho que V-JEPA 2 sea de código abierto, lo que permite a los desarrolladores acceder, probar e integrar en una variedad de casos de uso.

Esto incluye dispositivos que necesitan navegar por su entorno con una mínima intervención humana o contexto a partir de datos etiquetados.

Según Meta, la dependencia del modelo de un razonamiento espacial simplificado en lugar de una gran entrada de datos podría hacerlo más eficiente, adaptable y escalable que los modelos de IA existentes.

Las implicaciones van más allá de la logística y la robótica.

Si los modelos mundiales como V-JEPA 2 continúan desarrollándose como se espera, pueden allanar el camino para que la IA opere de forma autónoma en entornos desconocidos, abriendo casos de uso en campos como la atención médica, la agricultura e incluso el socorro en caso de desastres.

Meta compartió que el lanzamiento marca un hito clave en su hoja de ruta de IA a largo plazo, especialmente a medida que se intensifica la competencia de OpenAI, Microsoft y Google.

A medida que los modelos mundiales se vuelven más centrales para el progreso de la IA, V-JEPA 2 posiciona a Meta para asumir un papel de liderazgo en la carrera por desarrollar inteligencia artificial de propósito general que pueda pensar y actuar más como un humano en el mundo real.