Nvidia melancarkan Nemotron 3: mengapa NVDA menjadikan model AI terbarunya sumber terbuka?

Nvidia pada hari Isnin mengumumkan keluarga Nemotron 3 model AI yang dikeluarkan secara terbuka, set data latihan dan perpustakaan kejuruteraan.

Ini menandakan dorongan agresif ke dalam pembangunan AI sumber terbuka.

Langkah itu menandakan niat Nvidia untuk menguasai bukan sahaja lapisan perkakasan kecerdasan buatan, tetapi juga lapisan perisian dan model.

Perkembangan itu berlaku di tengah-tengah syarikat di seluruh dunia yang mencari alternatif domestik yang boleh diaudit kepada sistem AI tertutup atau asing.

Keluaran itu menggabungkan pemberat model, korpus pralatihan sintetik hampir 10 trilion token dan resipi latihan terperinci di bawah lesen terbuka.

Ia membolehkan pembangun dan perusahaan memeriksa, menyesuaikan dan menggunakan model Nemotron pada infrastruktur mereka sendiri.

Pengiraan strategik adalah telus, kerana AI sumber terbuka berkembang biak di seluruh dunia.

Dengan agensi kerajaan di AS menuntut ketelusan, Nvidia meletakkan dirinya sebagai pembekal domestik yang dipercayai, sambil mengukuhkan ekosistem pembangunnya.

Apa yang dikeluarkan oleh Nvidia: Model, data dan tuntutan teknikal

Keluarga Nemotron 3 terdiri daripada tiga model dalam saiz yang semakin meningkat: Nano (30 bilion parameter dengan 3 bilion aktif), Super (100 bilion dengan 10 bilion aktif), dan Ultra (500 bilion dengan 50 bilion aktif).

Hanya Nemotron 3 Nano kapal serta-merta; Super dan Ultra tiba pada separuh pertama 2026.

Tuntutan marquee Nvidia ialah kecekapan. Nemotron 3 Nano menyampaikan empat kali ganda pemprosesan pendahulunya Nemotron 2 dan mengurangkan penjanaan token penaakulan sehingga 60%.

Model menggunakan seni bina campuran pakar terpendam hibrid, reka bentuk yang mengaktifkan hanya laluan pengiraan yang paling relevan untuk setiap tugas, meniru cara otak manusia berfungsi.

Pendekatan ini telah menjadi standard industri, dengan 10 model sumber terbuka paling pintar kini menggunakan MoE, menurut data penanda aras bebas.

Perlu diingatkan bahawa jumlah maklumat yang boleh disimpan oleh model dalam ingatan berkembang kepada satu juta token untuk Nano, tujuh kali lebih luas daripada pendahulunya.

Itu penting untuk dokumen bentuk panjang, repositori kod dan penaakulan berbilang langkah yang kompleks.

Super dan Ultra memanfaatkan format latihan NVFP4 4-bit Nvidia pada perkakasan Blackwellnya, mengurangkan keperluan memori dan masa latihan tanpa mengorbankan ketepatan.

Semua pemberat model, korpus latihan dan resipi terperinci tersedia di GitHub dan Hugging Face di bawah Lesen Model Terbuka NVIDIA.

Pembangun juga mendapat akses kepada NeMo Gym, NeMo RL dan NeMo Evaluator, perpustakaan sumber terbuka untuk latihan, pembelajaran pengukuhan dan pengesahan keselamatan.

Mengapa pelepasan terbuka penting?

Keluaran terbuka secara langsung bertindak balas kepada permintaan perusahaan yang semakin meningkat untuk ketelusan model.

"Ramai pelanggan perusahaan kami tidak boleh menggunakan model tertentu atau membina perniagaan mereka pada model dengan kod sumber legap," kata Kari Briski, Naib Presiden perisian AI generatif Nvidia.

Industri yang dikawal selia seperti penjagaan kesihatan, kewangan dan pertahanan memerlukan alternatif di premis yang boleh diaudit kepada sistem proprietari yang dikawal oleh entiti asing.

Langkah Nvidia semakin kuat apabila Meta berundur daripada sumber terbuka. Pertumbuhan Llama terhenti selepas pelancaran Llama 4 yang suam-suam kuku pada bulan April, menyerahkan tanah kepada model terbuka yang menyaingi.

Meta telah menahan set data latihan walaupun daripada rakan kongsi rapat seperti Nvidia, mengehadkan penambahbaikan dipacu komuniti.

Sebaliknya, Nvidia menerbitkan segala-galanya: berat, resipi dan set data. Ketelusan itu boleh menarik pelanggan perusahaan dan kontrak kerajaan yang berhati-hati dengan kebergantungan yang tidak jelas.

Dari segi geopolitik, tarif AS dan sekatan eksport ke atas AI China menguatkan kelebihan Nvidia.

Nvidia melancarkan Nemotron 3: mengapa NVDA menjadikan model AI terbarunya sumber terbuka?

Apa yang dikeluarkan oleh Nvidia: Model, data dan tuntutan teknikal

Mengapa pelepasan terbuka penting?

Nikkei 225, Kospi goncang pasaran Asia apabila kejatuhan AI bertembung dengan kebimbangan Fed

Saham Samsung naik lebih 4% selepas keuntungan rekod — sejauh mana ia boleh meningkat?

Dua saham untuk dipantau dalam pusingan sektor pasaran saham

4 sebab utama mengapa Indeks Kospi Korea Selatan dan ETF EWY jatuh

Saham Qualcomm turun apabila kekurangan memori menjejaskan hasil suku kedua