Invezz

Meta julkistaa V-JEPA 2:n: Tekoälymalli ennustaa todellista liikettä ilman videodataa

Meta julkistaa V-JEPA 2:n: Tekoälymalli ennustaa todellista liikettä ilman videodataa
Diya Poddar
11.6.2025, 19:50 IP.
  • Meta lanseerasi V-JEPA 2:n, "maailmanmallin", joka oppii merkitsemättömästä videosta reaaliaikaista tilallista ymmärtämistä varten.
  • Meta investoi 14 miljardia dollaria Scale AI:hen, mikä on merkki merkittävästä sysäyksestä tekoälyyn ja robotiikkaan ydintarjonnassaan.
  • V-JEPA 2:n avoimen lähdekoodin julkaisu kiristää kilpailua "maailmanmallin" tekoälytilassa.

Meta on lanseerannut uuden tekoälyjärjestelmän nimeltä V-JEPA 2, jonka tarkoituksena on muuttaa sitä, miten koneet ymmärtävät ja navigoivat fyysisessä maailmassa.

Avoimen lähdekoodin malli, joka paljastettiin keskiviikkona VivaTech-konferenssissa Pariisissa, jäljittelee ihmisen päättelyä ennakoidakseen fyysisiä tuloksia – kuten pöydältä putoavaa palloa tai esinettä, joka pysyy paikallaan, kun se on poissa näkyvistä.

Toisin kuin perinteiset mallit, jotka perustuvat kommentoituihin kuviin tai videoihin, V-JEPA 2 käyttää "piilevää tilaa" simuloidakseen reaalimaailman dynamiikkaa, mikä merkitsee siirtymistä kielipohjaisesta tekoälystä spatiaalisesti tietoisempiin järjestelmiin.

Uusi tekoälyn läpimurto simuloi ihmisen kaltaista päättelyä reaaliajassa

V-JEPA 2 -malli edustaa Metan viimeisintä edistysaskelta tekoälyjärjestelmissä, jotka tunnetaan nimellä "maailmanmallit" – konsepti, joka on saamassa vetovoimaa kehittäjien keskuudessa, jotka haluavat siirtyä suurten kielimallien ulkopuolelle.

Nämä järjestelmät yrittävät rakentaa sisäisiä todellisuussimulaatioita, jotka auttavat koneita ennustamaan tuloksia ja suunnittelemaan toimia sen mukaisesti.

Metan mukaan V-JEPA 2 voi suorittaa tämän päättelyn ilman merkittyä videomateriaalia, mikä erottaa sen olemassa olevista generatiivisista tekoälyjärjestelmistä, kuten ChatGPT:stä tai Geministä.

Malli on rakennettu mahdollistamaan reaaliaikainen spatiaalinen ymmärrys tekoälyyn perustuville teknologioille, kuten autonomisille ajoneuvoille, varastoroboteille ja drone-toimitusjärjestelmille.

Metan johtava tekoälytutkija Yann LeCun kuvaili videoesityksessä V-JEPA 2:ta "todellisuuden abstraktiksi digitaaliseksi kaksoseksi", jonka avulla tekoäly voi "ennustaa tekojensa seurauksia" ja "suunnitella toimintatavan tietyn tehtävän suorittamiseksi".

Meta laajentaa tekoälyn painopistettä 14 miljardin dollarin mittakaavan tekoälysijoituksella

Metan V-JEPA 2:n lanseeraus tapahtuu aikana, jolloin yhtiö kaksinkertaistaa tekoälytavoitteensa.

Teknologiajätin kerrotaan investoivan 14 miljardia dollaria Scale AI:hen, San Franciscossa sijaitsevaan startup-yritykseen, joka toimittaa koulutustietoja koneoppimiseen.

Alexandr Wangin perustaman yrityksen odotetaan olevan avainroolissa Metan tekoälyn kehityksen seuraavassa vaiheessa.

Asiaan perehtyneiden ihmisten mukaan Wang palkataan myös johtamaan Metan keskeisiä tekoälyaloitteita.

Tämä investointi on linjassa toimitusjohtaja Mark Zuckerbergin ilmoittaman tavoitteen kanssa sisällyttää tekoäly Metan ydintarjontaan.

Yhtiö ei pyri vain parantamaan Facebookin ja Instagramin käyttökokemusta tekoälyn avulla, vaan myös kehittämään pitkän aikavälin kykyjä robotiikassa ja autonomisissa järjestelmissä.

Kilpailu maailmanmallien kehittäjien kesken kiihtyy

Metan ponnistelut seuraavat tekoälytutkimuksen kasvavaa trendiä kohti maailmanmallintamista.

Viime vuoden syyskuussa tekoälytutkija Fei-Fei Li keräsi 230 miljoonaa dollaria World Labs -nimiseen startup-yritykseen, joka keskittyy myös suuren mittakaavan maailmanmallien rakentamiseen.

Samaan aikaan Googlen DeepMind-yksikkö testaa omaa maailmanmalliprojektiaan nimeltä Genie, joka on suunniteltu simuloimaan pelejä ja virtuaaliympäristöjä reaaliajassa.

Toisin kuin suuret kielimallit, jotka tulkitsevat ja tuottavat tekstiä, maailmanmallit asettavat etusijalle spatiaalisen ymmärryksen, kausaalisen päättelyn ja ennustamisen.

Näistä malleista voi tulla välttämättömiä mille tahansa tekoälylle, joka toimii dynaamisissa, todellisissa ympäristöissä – toimitusboteista tehdasautomaatiojärjestelmiin.

Miten V-JEPA 2 voisi muokata tekoälysovelluksia

Meta on tehnyt V-JEPA 2:sta avoimen lähdekoodin, jonka avulla kehittäjät voivat käyttää, testata ja integroida sitä erilaisiin käyttötapauksiin.

Tämä sisältää laitteet, joiden on navigoitava ympäristössään minimaalisella ihmisen panoksella tai kontekstilla merkityistä tiedoista.

Metan mukaan mallin riippuvuus yksinkertaistetusta spatiaalisesta päättelystä raskaan tiedonsyötön sijaan voi tehdä siitä tehokkaamman, mukautuvamman ja skaalautuvamman kuin nykyiset tekoälymallit.

Vaikutukset ulottuvat logistiikkaa ja robotiikkaa pidemmälle.

Jos V-JEPA 2:n kaltaiset maailmanmallit kehittyvät odotetusti, ne voivat tasoittaa tietä tekoälyn itsenäiselle toiminnalle tuntemattomissa ympäristöissä, mikä avaa käyttötapauksia esimerkiksi terveydenhuollon, maatalouden ja jopa katastrofiavun aloilla.

Meta kertoi, että lanseeraus on tärkeä virstanpylväs sen pitkän aikavälin tekoälysuunnitelmassa, varsinkin kun kilpailu OpenAI:n, Microsoftin ja Googlen kanssa kiristyy.

Kun maailmanmalleista tulee keskeisempiä tekoälyn kehityksessä, V-JEPA 2 asettaa Metan ottamaan johtavan roolin kilpailussa yleiskäyttöisen tekoälyn kehittämiseksi, joka voi ajatella ja toimia enemmän kuin ihminen todellisessa maailmassa.