Invezz

Meta avduker V-JEPA 2: AI-modell forutsier bevegelse i den virkelige verden uten videodata

Meta avduker V-JEPA 2: AI-modell forutsier bevegelse i den virkelige verden uten videodata
Diya Poddar
11. juni 2025, 18:50 P.M.
  • Meta lanserte V-JEPA 2, en «verdensmodell» som lærer av umerket video for romlig forståelse i sanntid.
  • Meta investerer 14 milliarder dollar i Scale AI, noe som signaliserer et stort fremstøt inn i AI og robotikk for sine kjernetilbud.
  • V-JEPA 2s åpen kildekode-utgivelse intensiverer konkurransen i "verdensmodellen" AI-området.

Meta har lansert et nytt kunstig intelligens-system kalt V-JEPA 2, som tar sikte på å transformere hvordan maskiner forstår og navigerer i den fysiske verden.

Åpen kildekode-modellen, avslørt onsdag på VivaTech-konferansen i Paris, etterligner menneskelig resonnement for å forutse fysiske utfall – som en ball som faller av et bord eller en gjenstand som forblir tilstede når den er ute av syne.

I motsetning til tradisjonelle modeller som er avhengige av kommenterte bilder eller video, bruker V-JEPA 2 et "latent rom" for å simulere dynamikk i den virkelige verden, noe som markerer et skifte fra språkbasert AI til mer romlig bevisste systemer.

Nytt AI-gjennombrudd simulerer menneskelignende resonnement i sanntid

V-JEPA 2-modellen representerer Metas siste fremskritt innen AI-systemer kjent som «verdensmodeller» – et konsept som får gjennomslag blant utviklere som ønsker å bevege seg utover store språkmodeller.

Disse systemene forsøker å bygge interne simuleringer av virkeligheten som hjelper maskiner med å forutsi utfall og planlegge handlinger deretter.

Ifølge Meta kan V-JEPA 2 utføre dette resonnementet uten å trenge merkede videoopptak, noe som skiller den fra eksisterende generative AI-systemer som ChatGPT eller Gemini.

Modellen er bygget for å muliggjøre romlig forståelse i sanntid for AI-drevne teknologier som autonome kjøretøy, lagerroboter og droneleveringssystemer.

I en videopresentasjon beskrev Metas Chief AI Scientist Yann LeCun V-JEPA 2 som en "abstrakt digital tvilling av virkeligheten" som lar AI "forutsi konsekvenser av sine handlinger" og "planlegge et handlingsforløp for å utføre en gitt oppgave."

Meta utvider AI-fokuset med en AI-investering på 14 milliarder dollar

Metas lansering av V-JEPA 2 kommer på et tidspunkt da selskapet dobler sine AI-ambisjoner.

Teknologigiganten investerer angivelig 14 milliarder dollar i Scale AI, en San Francisco-basert oppstart som leverer treningsdata for maskinlæring.

Firmaet, grunnlagt av Alexandr Wang, forventes å spille en nøkkelrolle i Metas neste fase av AI-utviklingen.

Ifølge folk som er kjent med saken, blir Wang også ansatt for å lede viktige AI-initiativer hos Meta.

Denne investeringen er i tråd med administrerende direktør Zuckerbergs uttalte mål om å bygge inn AI i Metas kjernetilbud.

Selskapet ønsker ikke bare å forbedre Facebook og Instagrams brukeropplevelse gjennom AI, men også å utvikle langsiktige evner innen robotikk og autonome systemer.

Konkurransen tilspisser seg blant verdensmodellutviklere

Metas innsats følger en økende trend innen AI-forskning mot verdensmodellering.

I september i fjor samlet AI-forsker Fei-Fei Li inn 230 millioner dollar til en oppstart kalt World Labs, som også er fokusert på å bygge verdensmodeller i stor skala.

I mellomtiden tester Googles DeepMind-enhet sitt eget verdensmodellprosjekt kalt Genie, designet for å simulere spill og virtuelle miljøer i sanntid.

I motsetning til store språkmodeller som tolker og genererer tekst, prioriterer verdensmodeller romlig forståelse, kausal resonnement og prediksjon.

Disse modellene kan bli avgjørende for all AI som opererer i dynamiske, virkelige miljøer – fra leveringsroboter til fabrikkautomatiseringssystemer.

Hvordan V-JEPA 2 kan omforme AI-applikasjoner

Meta har gjort V-JEPA 2 åpen kildekode, slik at utviklere kan få tilgang til, teste og integrere den i en rekke brukstilfeller.

Dette inkluderer enheter som trenger å navigere i omgivelsene med minimalt med menneskelig input eller kontekst fra merkede data.

Ifølge Meta kan modellens avhengighet av forenklet romlig resonnement i stedet for tung datainngang gjøre den mer effektiv, tilpasningsdyktig og skalerbar enn eksisterende AI-modeller.

Implikasjonene går utover logistikk og robotikk.

Hvis verdensmodeller som V-JEPA 2 fortsetter å utvikle seg som forventet, kan de bane vei for AI til å operere autonomt i ukjente miljøer, og åpne for brukstilfeller innen felt som helsevesen, landbruk og til og med katastrofehjelp.

Meta delte at lanseringen markerer en viktig milepæl i det langsiktige AI-veikartet, spesielt ettersom konkurransen fra OpenAI, Microsoft og Google intensiveres.

Etter hvert som verdensmodeller blir mer sentrale for AI-fremgang, posisjonerer V-JEPA 2 Meta til å ta en ledende rolle i kappløpet om å utvikle generell kunstig intelligens som kan tenke og oppføre seg mer som et menneske i den virkelige verden.