Nvidia prezentuje Nemotron 3: dlaczego NVDA udostępnia swoje najnowsze modele AI jako open source?

Nvidia prezentuje Nemotron 3: dlaczego NVDA udostępnia swoje najnowsze modele AI jako open source?
Devesh Kumar
15 gru 2025, 16:26 PM
  • Nvidia wypuściła Nemotron 3 Nano już teraz, a większe modele Super i Ultra planowane są na początek 2026 roku.
  • Otwarta wersja zawiera wagi modeli, zbiory danych oraz narzędzia treningowe na licencji NVIDIA Open Model License.
  • Ten ruch jest skierowany do zapotrzebowania przedsiębiorstw i rządu na audytowalne, lokalne alternatywy AI.

Nvidia w poniedziałek ogłosiła rodzinę Nemotron 3 – publicznie udostępniane modele AI, zbiory danych treningowych oraz biblioteki inżynierskie.

To oznacza agresywny krok w kierunku rozwoju AI open-source.

Ten ruch sygnalizuje zamiar Nvidii, by zdominować nie tylko warstwę sprzętową sztucznej inteligencji, ale także warstwy oprogramowania i modeli.

Rozwój ten następuje w czasie, gdy firmy na całym świecie poszukują krajowych, audytowalnych alternatyw dla zamkniętych lub zagranicznych systemów AI.

Wydanie zawiera pakiety wag modeli, syntetyczny korpus pretreningowy liczący prawie 10 bilionów tokenów oraz szczegółowe receptury treningowe na otwartej licencji.

Pozwala deweloperom i przedsiębiorstwom na inspekcję, dostosowywanie i wdrażanie modeli Nemotron na własnej infrastrukturze.

Strategiczne kalkulacje są przejrzyste, ponieważ otwartoźródłowa AI rozprzestrzenia się na całym świecie.

W związku z żądaniami przejrzystości przez amerykańskie agencje rządowe, Nvidia pozycjonuje się jako zaufany krajowy dostawca, jednocześnie wzmacniając swój ekosystem deweloperów.

Co Nvidia opublikowała: Modele, dane i twierdzenia techniczne

Rodzina Nemotron 3 składa się z trzech modeli o rosnących rozmiarach: Nano (30 miliardów parametrów, z czego 3 miliardy aktywnych), Super (100 miliardów, 10 miliardów aktywnych) oraz Ultra (500 miliardów przy 50 miliardach aktywnych).

Natychmiast tylko Nemotron 3 opuszcza Nano; Super i Ultra pojawią się w pierwszej połowie 2026 roku.

Głównym twierdzeniem Nvidii jest efektywność. Nemotron 3 Nano dostarcza czterokrotnie większą przepustowość niż poprzednik Nemotron 2 i zmniejsza generowanie tokenów rozumowania nawet o 60%.

Modele wykorzystują hybrydową architekturę ukrytej mieszanki ekspertów, projekt, który aktywuje tylko najbardziej istotne ścieżki obliczeniowe dla każdego zadania, naśladując sposób, w jaki ludzki mózg dzieli pracę.

To podejście stało się standardem branżowym, a według niezależnych danych benchmarkingowych obecnie 10 najbardziej inteligentnych modeli open-source korzysta z MoE.

Należy zauważyć, że ilość informacji, jaką model może przechowywać w pamięci, wzrasta do miliona tokenów dla Nano, co jest siedmiokrotnie większą ilością niż w poprzedniku.

To ma znaczenie dla dokumentów długich form, repozytoriów kodu i złożonego wieloetapowego rozumowania.

Super i Ultra wykorzystują 4-bitowy format treningowy NVFP4 Nvidii na sprzęcie Blackwell, co znacznie ogranicza wymagania do pamięci i czas treningu bez utraty dokładności.

Wszystkie wagi modeli, korpusy treningowe oraz szczegółowe przepisy są dostępne na GitHub i Hugging Face na licencji NVIDIA Open Model License.

Deweloperzy uzyskują także dostęp do NeMo Gym, NeMo RL i NeMo Evaluator, otwartych bibliotek do szkoleń, uczenia ze wzmocnieniem i weryfikacji bezpieczeństwa.

Dlaczego otwarte wydanie jest ważne?

Otwarte wydanie bezpośrednio odpowiada na rosnące zapotrzebowanie przedsiębiorstw na przejrzystość modeli.

"Wielu naszych klientów korporacyjnych nie może wdrażać określonych modeli ani budować biznesu na modelach z nieprzejrzystymi kodami źródłowymi" – powiedziała Kari Briski, wiceprezes ds. generatywnego oprogramowania AI w Nvidii.

Regulowane branże, takie jak opieka zdrowotna, finanse i obrona, wymagają audytowalnych, lokalnych alternatyw dla systemów własnościowych kontrolowanych przez zagraniczne podmioty.

Ruch Nvidii zyskuje na sile, gdy Meta wycofuje się z open-source. Wzrost Llama zatrzymał się po letniej premierze Llama 4 w kwietniu, ustępując miejsca rywalizującym modelom otwartymi.

Meta wstrzymała treningowe zbiory danych nawet przed bliskimi partnerami, takimi jak Nvidia, ograniczając ulepszenia napędzane przez społeczność.

Dla porównania, Nvidia publikuje wszystko: wagi, przepisy i zbiory danych. Ta przejrzystość mogłaby przyciągnąć klientów korporacyjnych i kontrakty rządowe, obawiające się nieprzejrzystych zależności.

Geopolitycznie amerykańskie cła i ograniczenia eksportowe na chińską sztuczną inteligencję wzmacniają przewagę Nvidii.