Invezz

Meta afslører V-JEPA 2: AI-model forudsiger bevægelse i den virkelige verden uden videodata

Meta afslører V-JEPA 2: AI-model forudsiger bevægelse i den virkelige verden uden videodata
Diya Poddar
11. jun. 2025, 18:50 PM
  • Meta lancerede V-JEPA 2, en "verdensmodel", der lærer af umærket video for rumlig forståelse i realtid.
  • Meta investerer 14 milliarder dollars i Scale AI, hvilket signalerer et stort skub ind i AI og robotteknologi for sine kernetilbud.
  • V-JEPA 2's open source-udgivelse intensiverer konkurrencen i AI-området "verdensmodel".

Meta har lanceret et nyt kunstig intelligens-system kaldet V-JEPA 2, der har til formål at transformere, hvordan maskiner forstår og navigerer i den fysiske verden.

Open source-modellen, der blev afsløret onsdag på VivaTech-konferencen i Paris, efterligner menneskelig ræsonnement for at forudse fysiske resultater - som en bold, der falder ned fra et bord, eller en genstand, der forbliver til stede, når den er ude af syne.

I modsætning til traditionelle modeller, der er afhængige af kommenterede billeder eller video, bruger V-JEPA 2 et "latent rum" til at simulere dynamik i den virkelige verden, hvilket markerer et skift fra sprogbaseret AI til mere rumligt bevidste systemer.

Nyt AI-gennembrud simulerer menneskelignende ræsonnement i realtid

V-JEPA 2-modellen repræsenterer Metas seneste fremskridt inden for AI-systemer kendt som "verdensmodeller" - et koncept, der vinder indpas blandt udviklere, der søger at bevæge sig ud over store sprogmodeller.

Disse systemer forsøger at opbygge interne simuleringer af virkeligheden, der hjælper maskiner med at forudsige resultater og planlægge handlinger i overensstemmelse hermed.

Ifølge Meta kan V-JEPA 2 udføre dette ræsonnement uden at have brug for mærkede videooptagelser, hvilket adskiller det fra eksisterende generative AI-systemer som ChatGPT eller Gemini.

Modellen er bygget til at muliggøre rumlig forståelse i realtid for AI-drevne teknologier såsom autonome køretøjer, lagerrobotter og droneleveringssystemer.

I en videopræsentation beskrev Metas Chief AI Scientist Yann LeCun V-JEPA 2 som en "abstrakt digital tvilling af virkeligheden", der gør det muligt for AI at "forudsige konsekvenserne af sine handlinger" og "planlægge en fremgangsmåde for at udføre en given opgave."

Meta udvider AI-fokus med $14 mia. Scale AI-investering

Metas lancering af V-JEPA 2 kommer på et tidspunkt, hvor virksomheden fordobler sine AI-ambitioner.

Teknologigiganten investerer angiveligt 14 milliarder dollars i Scale AI, en San Francisco-baseret startup, der leverer træningsdata til maskinlæring.

Firmaet, der blev grundlagt af Alexandr Wang, forventes at spille en nøglerolle i Metas næste fase af AI-udviklingen.

Ifølge folk, der er bekendt med sagen, bliver Wang også ansat til at lede vigtige AI-initiativer hos Meta.

Denne investering er i overensstemmelse med CEO Mark Zuckerbergs erklærede mål om at integrere AI i Metas kernetilbud.

Virksomheden søger ikke kun at forbedre Facebooks og Instagrams brugeroplevelse gennem AI, men også at udvikle langsigtede muligheder inden for robotteknologi og autonome systemer.

Konkurrencen mellem verdensmodeludviklere bliver hårdere

Metas indsats følger en voksende tendens inden for AI-forskning mod verdensmodellering.

I september sidste år rejste AI-forsker Fei-Fei Li 230 millioner dollars til en startup kaldet World Labs, som også er fokuseret på at bygge verdensmodeller i stor skala.

I mellemtiden tester Googles DeepMind-enhed sit eget verdensmodelprojekt kaldet Genie, designet til at simulere spil og virtuelle miljøer i realtid.

I modsætning til store sprogmodeller, der fortolker og genererer tekst, prioriterer verdensmodeller rumlig forståelse, kausal ræsonnement og forudsigelse.

Disse modeller kan blive afgørende for enhver AI, der opererer i dynamiske miljøer i den virkelige verden – fra leveringsbots til fabriksautomatiseringssystemer.

Hvordan V-JEPA 2 kan omforme AI-applikationer

Meta har gjort V-JEPA 2 open source, hvilket giver udviklere mulighed for at få adgang til, teste og integrere det i en række forskellige brugssager.

Dette omfatter enheder, der har brug for at navigere i deres omgivelser med minimalt menneskeligt input eller kontekst fra mærkede data.

Ifølge Meta kan modellens afhængighed af forenklet rumlig ræsonnement frem for tungt datainput gøre den mere effektiv, tilpasningsdygtig og skalerbar end eksisterende AI-modeller.

Implikationerne rækker ud over logistik og robotteknologi.

Hvis verdensmodeller som V-JEPA 2 fortsætter med at udvikle sig som forventet, kan de bane vejen for, at AI kan fungere autonomt i ukendte miljøer, hvilket åbner op for brugsscenarier inden for områder som sundhedspleje, landbrug og endda katastrofehjælp.

Meta delte, at lanceringen markerer en vigtig milepæl i dens langsigtede AI-køreplan, især da konkurrencen fra OpenAI, Microsoft og Google intensiveres.

Efterhånden som verdensmodeller bliver mere centrale for AI-fremskridt, positionerer V-JEPA 2 Meta til at tage en ledende rolle i kapløbet om at udvikle kunstig intelligens til generelle formål, der kan tænke og handle mere som et menneske i den virkelige verden.