Nvidia presenta Nemotron 3: perché NVDA sta rendendo open source i suoi ultimi modelli di IA?

Nvidia presenta Nemotron 3: perché NVDA sta rendendo open source i suoi ultimi modelli di IA?
Devesh Kumar
15 dic 2025, 16:26 PM
  • Nvidia ha rilasciato ora Nemotron 3 Nano, con modelli Super e Ultra più grandi previsti per l'inizio del 2026.
  • La versione aperta include pesi di modello, dataset e strumenti di addestramento sotto la licenza NVIDIA Open Model.
  • La mossa si rivolge alla domanda di aziende e governi di alternative di IA on-premises e auditabili.

Lunedì Nvidia ha annunciato la famiglia Nemotron 3 di modelli di IA rilasciati apertamente, dataset di addestramento e librerie ingegneristiche.

Questo segna una spinta aggressiva verso lo sviluppo open source di IA.

La mossa segnala l'intenzione di Nvidia di dominare non solo il livello hardware dell'intelligenza artificiale, ma anche quello software e quello dei modelli.

Lo sviluppo arriva in un momento in cui aziende di tutto il mondo cercano alternative nazionali e verificabili ai sistemi di intelligenza artificiale chiusi o esteri.

Il rilascio include pesi modello, un corpus preaddestramento sintetico di quasi 10 trilioni di token e ricette di addestramento dettagliate sotto licenza aperta.

Permette a sviluppatori e aziende di ispezionare, personalizzare e distribuire modelli Nemotron sulla propria infrastruttura.

Il calcolo strategico è trasparente, poiché l'IA open-source si diffonde a livello globale.

Con le agenzie governative negli Stati Uniti che chiedono trasparenza, Nvidia si sta posizionando come fornitore nazionale affidabile, rafforzando al contempo il suo ecosistema di sviluppatori.

Cosa ha rilasciato Nvidia: Modelli, dati e affermazioni tecniche

La famiglia Nemotron 3 è composta da tre modelli in dimensioni crescenti: Nano (30 miliardi di parametri con 3 miliardi attivi), Super (100 miliardi con 10 miliardi attivi) e Ultra (500 miliardi con 50 miliardi attivi).

Solo il Nemotron 3 Nano viene spedito immediatamente; Super e Ultra arrivano nella prima metà del 2026.

La dichiarazione principale di Nvidia è l'efficienza. Nemotron 3 Nano offre quattro volte la capacità di throughput del suo predecessore Nemotron 2 e riduce la generazione dei token di ragionamento fino al 60%.

I modelli impiegano un'architettura ibrida latente a miscela di esperti, un design che attiva solo i percorsi computazionali più rilevanti per ogni compito, imitando come il cervello umano compartimentalizza il lavoro.

Questo approccio è diventato lo standard del settore, con i primi 10 modelli open-source più intelligenti che ora utilizzano il MoE, secondo dati di benchmarking indipendenti.

Va notato che la quantità di informazioni che un modello può contenere in memoria si espande fino a un milione di token per Nano, sette volte più ampia rispetto al suo predecessore.

Questo è importante per documenti lunghi, repository di codice e ragionamento complesso a più fasi.

Super e Ultra sfruttano il formato di addestramento NVFP4 a 4 bit di Nvidia sul suo hardware Blackwell, riducendo i requisiti di memoria e i tempi di addestramento senza sacrificare la precisione.

Tutti i pesi dei modelli, i corpi di allenamento e le ricette dettagliate sono disponibili su GitHub e Hugging Face sotto la licenza NVIDIA Open Model License.

Gli sviluppatori hanno anche accesso a NeMo Gym, NeMo RL e NeMo Evaluator, le librerie open source per addestramento, apprendimento per rinforzo e validazione della sicurezza.

Perché aprire la questione di rilascio?

La release aperta risponde direttamente alla crescente domanda aziendale di trasparenza del modello.

"Molti dei nostri clienti enterprise non possono distribuire certi modelli o costruire il loro business su modelli con codici sorgente opaci", ha detto Kari Briski, vicepresidente del software di IA generativa di Nvidia.

Settori regolamentati come sanità, finanza e difesa richiedono alternative auditabili e on-premises ai sistemi proprietari controllati da entità straniere.

La mossa di Nvidia prende forza mentre Meta si ritira dall'open-source. La crescita di Llama si è fermata dopo il lancio tiepido di Llama 4 ad aprile, cedendo terreno a modelli aperti concorrenti.

Meta ha negato i dataset di addestramento anche a partner stretti come Nvidia, limitando i miglioramenti guidati dalla comunità.

Al contrario, Nvidia pubblica tutto: pesi, ricette e dataset. Questa trasparenza potrebbe attirare clienti enterprise e contratti governativi diffidenti verso dipendenze opache.

Geopoliticamente, i dazi e le restrizioni statunitensi all'esportazione sull'IA cinese amplificano il vantaggio di Nvidia.