Nvidia dévoile Nemotron 3 : pourquoi NVDA rend-elle ses derniers modèles d’IA open source ?

Nvidia a annoncé lundi la famille Nemotron 3 de modèles d’IA, de jeux de données d’entraînement et de bibliothèques d’ingénierie publiés ouvertement.

Cela marque une poussée agressive vers le développement d’IA open source.

Cette décision signale l’intention de Nvidia de dominer non seulement la couche matérielle de l’intelligence artificielle, mais aussi les couches logiciel et modèle.

Ce développement intervient alors que des entreprises du monde entier recherchent des alternatives nationales et auditables aux systèmes d’IA fermés ou étrangers.

La version regroupe des poids de modèles, un corpus synthétique de préentraînement de près de 10 000 milliards de jetons, ainsi que des recettes d’entraînement détaillées sous licence ouverte.

Il permet aux développeurs et aux entreprises d’inspecter, de personnaliser et de déployer les modèles Nemotron sur leur propre infrastructure.

Le calcul stratégique est transparent, car l’IA open source se répand à l’échelle mondiale.

Avec les agences gouvernementales américaines qui exigent la transparence, Nvidia se positionne comme le fournisseur national de confiance, tout en renforçant son écosystème de promoteurs.

Ce que Nvidia a publié : Modèles, données et affirmations techniques

La famille Nemotron 3 se compose de trois modèles en taille croissante : Nano (30 milliards de paramètres avec 3 milliards actifs), Super (100 milliards avec 10 milliards actifs) et Ultra (500 milliards avec 50 milliards actifs).

Seuls les Nano Nemotron 3 sont envoyés immédiatement ; Super et Ultra arrivent dans la première moitié de 2026.

La revendication phare de Nvidia est l’efficacité. Nemotron 3 Nano offre un débit quatre fois supérieur à celui de son prédécesseur Nemotron 2 et réduit la génération de jetons de raisonnement jusqu’à 60 %.

Les modèles utilisent une architecture hybride latente mélange d’experts, un design qui active uniquement les voies de calcul les plus pertinentes pour chaque tâche, imitant la façon dont le cerveau humain compartimente le travail.

Cette approche est devenue la norme de l’industrie, les 10 modèles open source les plus intelligents utilisant désormais le MoE, selon des données de benchmarking indépendantes.

Il faut noter que la quantité d’informations qu’un modèle peut contenir en mémoire atteint un million de jetons pour Nano, soit sept fois plus que son prédécesseur.

Cela compte pour les documents longs, les dépôts de code et le raisonnement complexe en plusieurs étapes.

Super et Ultra exploitent le format d’entraînement NVFP4 4 bits de Nvidia sur son matériel Blackwell, réduisant considérablement les besoins en mémoire et le temps d’entraînement sans sacrifier la précision.

Tous les poids de modèles, corpus d’entraînement et recettes détaillées sont disponibles sur GitHub et Hugging Face sous la licence NVIDIA Open Model License.

Les développeurs ont également accès à NeMo Gym, NeMo RL et NeMo Evaluator, les bibliothèques open source pour l’entraînement, l’apprentissage par renforcement et la validation de la sécurité.

Pourquoi ouvrir la matière de libération ?

La version ouverte répond directement à la demande croissante des entreprises pour la transparence des modèles.

« Beaucoup de nos clients d’entreprise ne peuvent pas déployer certains modèles ni construire leur entreprise sur des modèles avec des codes sources opaques », a déclaré Kari Briski, vice-présidente des logiciels d’IA générative chez Nvidia.

Les secteurs réglementés comme la santé, la finance et la défense exigent des alternatives auditables sur site aux systèmes propriétaires contrôlés par des entités étrangères.

La décision de Nvidia prend de l’ampleur alors que Meta se retire de l’open source. La croissance de Llama a ralenti après le lancement tiède de Llama 4 en avril, cédant du terrain à des modèles ouverts rivaux.

Meta a retenu les ensembles de données d’entraînement même à des partenaires proches comme Nvidia, limitant les améliorations menées par la communauté.

En revanche, Nvidia publie tout : poids, recettes et jeux de données. Cette transparence pourrait attirer des clients d’entreprise et des contrats gouvernementaux méfiants face à des dépendances opaques.

Géopolitiquement, les droits de douane américains et les restrictions à l’exportation sur l’IA chinoise amplifient l’avantage de Nvidia.

Nvidia dévoile Nemotron 3 : pourquoi NVDA rend-elle ses derniers modèles d’IA open source ?

Ce que Nvidia a publié : Modèles, données et affirmations techniques

Pourquoi ouvrir la matière de libération ?

Le Dow chute de près de 400 pts; les puces accentuent la baisse hebdomadaire

Microsoft en baisse, analystes abaissent leurs objectifs avant le T4

Digest du soir : Moonshot déclenche une vente liée à l'IA, Apple reprend la première place

Pourquoi Wall Street attend cet événement majeur pour l’action AMD

Meta pourrait bientôt louer sa puissance de calcul à Anthropic