Meta prezentuje V-JEPA 2: model sztucznej inteligencji przewiduje ruch w świecie rzeczywistym bez danych wideo

Meta wprowadziła na rynek nowy system sztucznej inteligencji o nazwie V-JEPA 2, którego celem jest zmiana sposobu, w jaki maszyny rozumieją świat fizyczny i poruszają się po nim.

Model open-source, zaprezentowany w środę na konferencji VivaTech w Paryżu, naśladuje ludzkie rozumowanie w celu przewidywania fizycznych rezultatów - takich jak piłka spadająca ze stołu lub przedmiot pozostający obecny, gdy jest poza zasięgiem wzroku.

W przeciwieństwie do tradycyjnych modeli, które opierają się na obrazach lub filmach z adnotacjami, V-JEPA 2 wykorzystuje "przestrzeń utajoną" do symulacji dynamiki świata rzeczywistego, co oznacza przejście od sztucznej inteligencji opartej na języku do bardziej świadomych przestrzennie systemów.

Nowe przełomowe rozwiązanie w dziedzinie sztucznej inteligencji symuluje rozumowanie podobne do ludzkiego w czasie rzeczywistym

Model V-JEPA 2 reprezentuje najnowsze osiągnięcie Meta w systemach sztucznej inteligencji znanych jako "modele światowe" – koncepcja, która zyskuje na popularności wśród programistów dążących do wyjścia poza duże modele językowe.

Systemy te próbują budować wewnętrzne symulacje rzeczywistości, które pomagają maszynom przewidywać wyniki i odpowiednio planować działania.

Według Meta, V-JEPA 2 może przeprowadzić to rozumowanie bez konieczności oznaczania materiału wideo, co odróżnia go od istniejących generatywnych systemów sztucznej inteligencji, takich jak ChatGPT czy Gemini.

Model został zbudowany, aby umożliwić zrozumienie przestrzenne w czasie rzeczywistym dla technologii opartych na sztucznej inteligencji, takich jak pojazdy autonomiczne, roboty magazynowe i systemy dostarczania dronów.

W prezentacji wideo główny naukowiec ds. sztucznej inteligencji Meta, Yann LeCun, opisał V-JEPA 2 jako "abstrakcyjnego cyfrowego bliźniaka rzeczywistości", który pozwala sztucznej inteligencji "przewidywać konsekwencje swoich działań" i "planować kierunek działań w celu wykonania danego zadania".

Meta rozszerza nacisk na sztuczną inteligencję dzięki inwestycji w sztuczną inteligencję o wartości 14 mld USD

Wprowadzenie na rynek V-JEPA 2 przez Meta następuje w czasie, gdy firma podwaja swoje ambicje w zakresie sztucznej inteligencji.

Gigant technologiczny podobno inwestuje 14 miliardów dolarów w Scale AI, startup z siedzibą w San Francisco, który dostarcza dane treningowe do uczenia maszynowego.

Oczekuje się, że firma, założona przez Alexandra Wanga, odegra kluczową rolę w kolejnej fazie rozwoju sztucznej inteligencji Meta.

Według osób zaznajomionych ze sprawą, Wang jest również zatrudniany do kierowania kluczowymi inicjatywami AI w Meta.

Inwestycja ta jest zgodna z deklarowanym celem dyrektora generalnego Marka Zuckerberga, jakim jest osadzenie sztucznej inteligencji w podstawowej ofercie Meta.

Firma chce nie tylko poprawić wrażenia użytkowników Facebooka i Instagrama za pomocą sztucznej inteligencji, ale także rozwinąć długoterminowe możliwości w zakresie robotyki i systemów autonomicznych.

Rośnie konkurencja wśród światowych twórców modeli

Wysiłki Meta wpisują się w rosnący trend w badaniach nad sztuczną inteligencją w kierunku modelowania świata.

We wrześniu ubiegłego roku badacz sztucznej inteligencji Fei-Fei Li zebrał 230 milionów dolarów dla startupu o nazwie World Labs, który również koncentruje się na budowaniu modeli świata na dużą skalę.

Tymczasem należąca do Google jednostka DeepMind testuje własny projekt modelu świata o nazwie Genie, przeznaczony do symulacji gier i środowisk wirtualnych w czasie rzeczywistym.

W przeciwieństwie do dużych modeli językowych, które interpretują i generują tekst, modele światowe priorytetowo traktują zrozumienie przestrzenne, rozumowanie przyczynowo-skutkowe i przewidywanie.

Modele te mogą stać się niezbędne dla każdej sztucznej inteligencji działającej w dynamicznych, rzeczywistych środowiskach — od botów dostawczych po systemy automatyki przemysłowej.

Jak V-JEPA 2 może zmienić kształt zastosowań sztucznej inteligencji

Firma Meta udostępniła V-JEPA 2 jako oprogramowanie typu open source, umożliwiając programistom dostęp, testowanie i integrowanie go z różnymi przypadkami użycia.

Obejmuje to urządzenia, które muszą poruszać się po swoim otoczeniu przy minimalnym wkładzie człowieka lub kontekście z oznaczonych danych.

Według Meta poleganie modelu na uproszczonym rozumowaniu przestrzennym, a nie na dużych nakładach danych, może sprawić, że będzie on bardziej wydajny, elastyczny i skalowalny niż istniejące modele sztucznej inteligencji.

Implikacje wykraczają poza logistykę i robotykę.

Jeśli modele światów, takie jak V-JEPA 2, będą nadal rozwijać się zgodnie z oczekiwaniami, mogą utorować drogę sztucznej inteligencji do autonomicznego działania w nieznanych środowiskach, otwierając przypadki użycia w takich dziedzinach jak opieka zdrowotna, rolnictwo, a nawet pomoc w przypadku klęsk żywiołowych.

Meta podzieliła się, że premiera stanowi kluczowy kamień milowy w jej długoterminowym planie rozwoju sztucznej inteligencji, zwłaszcza że nasila się konkurencja ze strony OpenAI, Microsoftu i Google.

W miarę jak modele światów stają się coraz bardziej kluczowe dla postępu w dziedzinie sztucznej inteligencji, V-JEPA 2 pozycjonuje Meta do przejęcia wiodącej roli w wyścigu o opracowanie sztucznej inteligencji ogólnego przeznaczenia, która może myśleć i działać bardziej jak człowiek w świecie rzeczywistym.

Meta prezentuje V-JEPA 2: model sztucznej inteligencji przewiduje ruch w świecie rzeczywistym bez danych wideo

Nowe przełomowe rozwiązanie w dziedzinie sztucznej inteligencji symuluje rozumowanie podobne do ludzkiego w czasie rzeczywistym

Meta rozszerza nacisk na sztuczną inteligencję dzięki inwestycji w sztuczną inteligencję o wartości 14 mld USD

Rośnie konkurencja wśród światowych twórców modeli

Jak V-JEPA 2 może zmienić kształt zastosowań sztucznej inteligencji

Akcje SpaceX blisko ceny IPO; analitycy wciąż nastawieni byczo

Akcje Palantir ugrzęzły w bessie: dlaczego mogą wkrótce odbić

Oracle: akcje poniżej wsparcia, rentowności obligacji rosną — co dalej?

Akcje Figma tworzą rzadki wzór podwójnego dna: czy nadejdzie odbicie?

Nowy Jork wstrzymuje budowę dużych centrów danych — roczne moratorium