Invezz

Meta presenterar V-JEPA 2: AI-modell förutsäger verkliga rörelser utan videodata

Meta presenterar V-JEPA 2: AI-modell förutsäger verkliga rörelser utan videodata
Diya Poddar
11 juni 2025, 18:50 EM
  • Meta lanserade V-JEPA 2, en "världsmodell" som lär sig av omärkt video för rumslig förståelse i realtid.
  • Meta investerar 14 miljarder dollar i Scale AI, vilket signalerar en stor satsning på AI och robotik för sina kärnerbjudanden.
  • V-JEPA 2:s version av öppen källkod intensifierar konkurrensen inom AI-området för "världsmodeller".

Meta har lanserat ett nytt system för artificiell intelligens, kallat V-JEPA 2, som syftar till att förändra hur maskiner förstår och navigerar i den fysiska världen.

Modellen med öppen källkod, som presenterades på onsdagen vid VivaTech-konferensen i Paris, efterliknar mänskligt resonemang för att förutse fysiska resultat – som en boll som faller från ett bord eller ett föremål som stannar kvar när det är utom synhåll.

Till skillnad från traditionella modeller som förlitar sig på kommenterade bilder eller video, använder V-JEPA 2 ett "latent utrymme" för att simulera dynamik i den verkliga världen, vilket markerar ett skifte från språkbaserad AI till mer rumsligt medvetna system.

Nytt AI-genombrott simulerar mänskligt resonemang i realtid

V-JEPA 2-modellen representerar Metas senaste framsteg inom AI-system som kallas "världsmodeller" – ett koncept som vinner mark bland utvecklare som vill gå bortom stora språkmodeller.

Dessa system försöker bygga interna simuleringar av verkligheten som hjälper maskiner att förutsäga resultat och planera åtgärder därefter.

Enligt Meta kan V-JEPA 2 utföra detta resonemang utan att behöva märkta videofilmer, vilket skiljer den från befintliga generativa AI-system som ChatGPT eller Gemini.

Modellen är byggd för att möjliggöra rumslig förståelse i realtid för AI-driven teknik som autonoma fordon, lagerrobotar och drönarleveranssystem.

I en videopresentation beskrev Metas Chief AI Scientist Yann LeCun V-JEPA 2 som en "abstrakt digital tvilling av verkligheten" som gör det möjligt för AI att "förutsäga konsekvenserna av sina handlingar" och "planera ett tillvägagångssätt för att utföra en viss uppgift".

Meta utökar sitt AI-fokus med en AI-investering på 14 miljarder dollar

Metas lansering av V-JEPA 2 kommer vid en tidpunkt då företaget fördubblar sina AI-ambitioner.

Teknikjätten uppges investera 14 miljarder dollar i Scale AI, en San Francisco-baserad startup som tillhandahåller träningsdata för maskininlärning.

Företaget, som grundades av Alexandr Wang, förväntas spela en nyckelroll i Metas nästa fas av AI-utveckling.

Enligt personer som är bekanta med saken anställs Wang också för att leda viktiga AI-initiativ på Meta.

Denna investering är i linje med vd Mark Zuckerbergs uttalade mål att bädda in AI i Metas kärnerbjudanden.

Företaget vill inte bara förbättra Facebooks och Instagrams användarupplevelse genom AI utan också utveckla långsiktiga funktioner inom robotik och autonoma system.

Konkurrensen hårdnar bland världens modellutvecklare

Metas ansträngningar följer en växande trend inom AI-forskning mot världsmodellering.

I september förra året samlade AI-forskaren Fei-Fei Li in 230 miljoner dollar till en startup som heter World Labs, som också är inriktad på att bygga storskaliga världsmodeller.

Samtidigt testar Googles DeepMind-enhet sitt eget världsmodellprojekt som heter Genie, som är utformat för att simulera spel och virtuella miljöer i realtid.

Till skillnad från stora språkmodeller som tolkar och genererar text, prioriterar världsmodeller rumslig förståelse, kausalt resonemang och förutsägelser.

Dessa modeller kan bli viktiga för all AI som arbetar i dynamiska, verkliga miljöer – från leveransrobotar till fabriksautomationssystem.

Hur V-JEPA 2 kan omforma AI-applikationer

Meta har gjort V-JEPA 2 med öppen källkod, vilket gör det möjligt för utvecklare att komma åt, testa och integrera det i en mängd olika användningsområden.

Detta inkluderar enheter som behöver navigera i sin omgivning med minimal mänsklig input eller kontext från märkta data.

Enligt Meta kan modellens beroende av förenklat rumsligt resonemang snarare än tung datainmatning göra den mer effektiv, anpassningsbar och skalbar än befintliga AI-modeller.

Konsekvenserna sträcker sig bortom logistik och robotik.

Om världsmodeller som V-JEPA 2 fortsätter att utvecklas som förväntat kan de bana väg för AI att fungera autonomt i okända miljöer, vilket öppnar upp för användningsområden som hälso- och sjukvård, jordbruk och till och med katastrofhjälp.

Meta delade med sig av att lanseringen markerar en viktig milstolpe i sin långsiktiga AI-färdplan, särskilt eftersom konkurrensen från OpenAI, Microsoft och Google intensifieras.

I takt med att världsmodeller blir allt mer centrala för AI-utvecklingen positionerar V-JEPA 2 Meta för att ta en ledande roll i kapplöpningen om att utveckla artificiell intelligens för allmänna ändamål som kan tänka och agera mer som en människa i den verkliga världen.