Nvidia dezvăluie Nemotron 3: de ce NVDA face cele mai noi modele AI open source?

Nvidia a anunțat luni familia Nemotron 3 de modele AI lansate deschis, seturi de date de antrenament și biblioteci inginerești.

Aceasta marchează o investiție agresivă în dezvoltarea AI open-source.

Această mișcare semnalează intenția Nvidia de a domina nu doar stratul hardware al inteligenței artificiale, ci și straturile software și model.

Această evoluție vine în contextul companiilor din întreaga lume care caută alternative interne, auditabile, la sistemele AI închise sau străine.

Lansarea include greutăți de model, un corpus preantrenor sintetic de aproape 10 trilioane de jetoane și rețete detaliate de antrenament sub o licență deschisă.

Permite dezvoltatorilor și companiilor să inspecteze, să personalizeze și să implementeze modele Nemotron pe propria infrastructură.

Calculul strategic este transparent, pe măsură ce AI open-source se răspândește la nivel global.

Cu agențiile guvernamentale din SUA cerând transparență, Nvidia se poziționează ca furnizorul intern de încredere, consolidând totodată ecosistemul său de dezvoltatori.

Ce a lansat Nvidia: Modele, date și afirmații tehnice

Familia Nemotron 3 constă din trei modele în dimensiuni în creștere: Nano (30 miliarde de parametri cu 3 miliarde activi), Super (100 miliarde cu 10 miliarde active) și Ultra (500 miliarde cu 50 miliarde active).

Doar Nemotron 3 Nano este lansat imediat; Super și Ultra sosesc în prima jumătate a anului 2026.

Afirmația de referință a Nvidia este eficiența. Nemotron 3 Nano oferă de patru ori mai mult debit decât predecesorul său Nemotron 2 și reduce generarea tokenurilor de raționament cu până la 60%.

Modelele folosesc o arhitectură hibridă latentă de experți, un design care activează doar cele mai relevante căi computaționale pentru fiecare sarcină, imitând modul în care creierul uman compartimentează munca.

Această abordare a devenit standardul industriei, primele 10 cele mai inteligente modele open-source folosind acum MoE, conform datelor independente de benchmarking.

Trebuie menționat că cantitatea de informații pe care un model o poate stoca în memorie crește la un milion de token-uri pentru Nano, de șapte ori mai larg decât predecesorul său.

Acest lucru contează pentru documente lungi, depozite de cod și raționament complex în mai mulți pași.

Super și Ultra valorifică formatul de antrenament NVFP4 pe 4 biți al Nvidia pe hardware-ul Blackwell, reducând cerințele de memorie și timpul de antrenare fără a sacrifica acuratețea.

Toate greutățile modelului, corpurile de antrenament și rețetele detaliate sunt disponibile pe GitHub și Hugging Face sub NVIDIA Open Model License.

Dezvoltatorii au, de asemenea, acces la NeMo Gym, NeMo RL și NeMo Evaluator, bibliotecile open-source pentru antrenament, învățare prin întărire și validarea siguranței.

De ce eliberarea deschisă a materialului?

Lansarea deschisă răspunde direct cererii tot mai mari din partea companiilor pentru transparența modelului.

"Mulți dintre clienții noștri enterprise nu pot implementa anumite modele sau să-și construiască afacerea pe modele cu coduri sursă opace", a declarat Kari Briski, VP software generativ AI la Nvidia.

Industriile reglementate precum sănătatea, finanțele și apărarea necesită alternative auditabile, on-premise, la sistemele proprietare controlate de entități străine.

Mișcarea Nvidia capătă forță pe măsură ce Meta se retrage din open-source. Creșterea Llama s-a oprit după lansarea călduță a Llama 4 din aprilie, cedând teren în fața modelelor rivale deschise.

Meta a reținut seturi de date de antrenament chiar și de la parteneri apropiați precum Nvidia, limitând îmbunătățirile generate de comunitate.

Prin contrast, Nvidia publică totul: greutăți, rețete și seturi de date. Această transparență ar putea atrage clienți enterprise și contracte guvernamentale reticenți față de dependențe opace.

Din punct de vedere geopolitic, tarifele și restricțiile de export ale SUA asupra inteligenței artificiale chineze amplifică avantajul Nvidia.

Nvidia dezvăluie Nemotron 3: de ce NVDA face cele mai noi modele AI open source?

Ce a lansat Nvidia: Modele, date și afirmații tehnice

De ce eliberarea deschisă a materialului?

Dow scade aproape 400 de puncte; vânzări masive la cipuri pun Wall Street pe minus

Acțiunile Microsoft scad; analiștii reduc țintele de preț înainte de rezultatele T4

Digestul serii: Moonshot declanșează vânzări AI; Apple revine lider la capitalizare

De ce Wall Street anticipează acest eveniment major pentru acțiunile AMD

Meta ar putea închiria în curând putere de calcul către Anthropic