Invezz

Meta melancarkan V-JEPA 2: Model AI meramalkan pergerakan dunia sebenar tanpa data video

Meta melancarkan V-JEPA 2: Model AI meramalkan pergerakan dunia sebenar tanpa data video
Diya Poddar
12 Jun 2025, 00:50 PG
  • Meta melancarkan V-JEPA 2, "model dunia" yang belajar daripada video tanpa label untuk pemahaman spatial masa nyata.
  • Meta melabur $14 bilion dalam Scale AI menandakan dorongan besar ke dalam AI dan robotik untuk tawaran terasnya.
  • Keluaran sumber terbuka V-JEPA 2 memperhebatkan persaingan dalam ruang AI "model dunia".

Meta telah melancarkan sistem kecerdasan buatan baharu yang dipanggil V-JEPA 2, bertujuan untuk mengubah cara mesin memahami dan menavigasi dunia fizikal.

Model sumber terbuka, yang didedahkan pada hari Rabu di persidangan VivaTech di Paris, meniru penaakulan manusia untuk menjangkakan hasil fizikal—seperti bola yang jatuh dari meja atau objek yang kekal hadir apabila ia tidak dapat dilihat.

Tidak seperti model tradisional yang bergantung pada imej atau video beranotasi, V-JEPA 2 menggunakan "ruang terpendam" untuk mensimulasikan dinamik dunia sebenar, menandakan peralihan daripada AI berasaskan bahasa kepada sistem yang lebih sedar ruang.

Kejayaan AI baharu mensimulasikan penaakulan seperti manusia dalam masa nyata

Model V-JEPA 2 mewakili kemajuan terbaharu Meta dalam sistem AI yang dikenali sebagai "model dunia"—konsep yang mendapat daya tarikan dalam kalangan pembangun yang ingin bergerak melangkaui model bahasa yang besar.

Sistem ini cuba membina simulasi realiti dalaman yang membantu mesin meramalkan hasil dan merancang tindakan dengan sewajarnya.

Menurut Meta, V-JEPA 2 boleh melakukan penaakulan ini tanpa memerlukan rakaman video berlabel, membezakannya daripada sistem AI generatif sedia ada seperti ChatGPT atau Gemini.

Model ini dibina untuk membolehkan pemahaman spatial masa nyata untuk teknologi dipacu AI seperti kenderaan autonomi, robot gudang dan sistem penghantaran dron.

Dalam pembentangan video, Ketua Saintis AI Meta Yann LeCun menggambarkan V-JEPA 2 sebagai "kembar digital abstrak realiti" yang membolehkan AI "meramalkan akibat tindakannya" dan "merancang tindakan untuk menyelesaikan tugas tertentu."

Meta mengembangkan tumpuan AI dengan pelaburan AI Skala $14B

Pelancaran V-JEPA 2 oleh Meta datang pada masa syarikat itu menggandakan cita-cita AInya.

Gergasi teknologi itu dilaporkan melabur $14 bilion ke dalam Scale AI, sebuah syarikat permulaan yang berpangkalan di San Francisco yang membekalkan data latihan untuk pembelajaran mesin.

Firma itu, yang diasaskan oleh Alexandr Wang, dijangka memainkan peranan penting dalam fasa pembangunan AI Meta yang seterusnya.

Menurut orang yang biasa dengan perkara itu, Wang juga diupah untuk mengetuai inisiatif AI utama di Meta.

Pelaburan ini sejajar dengan matlamat Ketua Pegawai Eksekutif Mark Zuckerberg untuk membenamkan AI ke dalam tawaran teras Meta.

Syarikat itu bukan sahaja ingin meningkatkan pengalaman pengguna Facebook dan Instagram melalui AI tetapi juga untuk membangunkan keupayaan jangka panjang dalam robotik dan sistem autonomi.

Persaingan semakin panas di kalangan pembangun model dunia

Usaha Meta mengikuti trend yang semakin meningkat dalam penyelidikan AI ke arah pemodelan dunia.

Pada September tahun lepas, penyelidik AI Fei-Fei Li mengumpul $230 juta untuk syarikat permulaan yang dipanggil World Labs, yang juga memberi tumpuan kepada membina model dunia berskala besar.

Sementara itu, unit DeepMind Google sedang menguji projek model dunianya sendiri yang dipanggil Genie, yang direka untuk mensimulasikan permainan dan persekitaran maya dalam masa nyata.

Tidak seperti model bahasa besar yang mentafsir dan menjana teks, model dunia mengutamakan pemahaman spatial, penaakulan kausal dan ramalan.

Model ini boleh menjadi penting untuk mana-mana AI yang beroperasi dalam persekitaran dunia sebenar yang dinamik—daripada bot penghantaran kepada sistem automasi kilang.

Bagaimana V-JEPA 2 boleh membentuk semula aplikasi AI

Meta telah menjadikan V-JEPA 2 sumber terbuka, membolehkan pembangun mengakses, menguji dan menyepadukannya ke dalam pelbagai kes penggunaan.

Ini termasuk peranti yang perlu menavigasi persekitaran mereka dengan input atau konteks manusia yang minimum daripada data berlabel.

Menurut Meta, pergantungan model pada penaakulan spatial yang dipermudahkan dan bukannya input data yang berat boleh menjadikannya lebih cekap, boleh disesuaikan dan berskala daripada model AI sedia ada.

Implikasinya melangkaui logistik dan robotik.

Jika model dunia seperti V-JEPA 2 terus berkembang seperti yang dijangkakan, ia mungkin membuka jalan kepada AI untuk beroperasi secara autonomi dalam persekitaran yang tidak dikenali, membuka kes penggunaan dalam bidang seperti penjagaan kesihatan, pertanian dan juga bantuan bencana.

Meta berkongsi bahawa pelancaran itu menandakan pencapaian penting dalam pelan hala tuju AI jangka panjangnya, terutamanya apabila persaingan daripada OpenAI, Microsoft dan Google semakin meningkat.

Memandangkan model dunia menjadi lebih penting kepada kemajuan AI, V-JEPA 2 meletakkan Meta untuk mengambil peranan utama dalam perlumbaan untuk membangunkan kecerdasan buatan tujuan umum yang boleh berfikir dan bertindak lebih seperti manusia di dunia nyata.