Nvidia stellt Nemotron 3 vor: Warum macht NVDA seine neuesten KI-Modelle Open Source?

Nvidia stellt Nemotron 3 vor: Warum macht NVDA seine neuesten KI-Modelle Open Source?
Devesh Kumar
15. Dez. 2025, 16:26 PM
  • Nvidia hat jetzt Nemotron 3 Nano veröffentlicht, mit größeren Super- und Ultra-Modellen, die für Anfang 2026 geplant sind.
  • Die offene Version enthält Modellgewichte, Datensätze und Trainingswerkzeuge unter der NVIDIA Open Model License.
  • Der Schritt richtet sich gegen die Nachfrage von Unternehmen und Regierung nach auditierbaren, vor Ort verfügbaren KI-Alternativen.

Nvidia kündigte am Montag die Nemotron 3-Familie offen veröffentlichter KI-Modelle, Trainingsdatensätze und Engineering-Bibliotheken an.

Dies markiert einen aggressiven Vorstoß in die Entwicklung von Open-Source-KI.

Dieser Schritt signalisiert Nvidias Absicht, nicht nur die Hardwareschicht der künstlichen Intelligenz, sondern auch die Software- und Modellschichten zu dominieren.

Die Entwicklung erfolgt in einer Zeit, in der Unternehmen weltweit nach inländischen, prüfbaren Alternativen zu geschlossenen oder ausländischen KI-Systemen suchen.

Die Veröffentlichung bündelt Modellgewichte, einen synthetischen Pretraining-Korpus von fast 10 Billionen Token und detaillierte Trainingsrezepte unter einer offenen Lizenz.

Es ermöglicht Entwicklern und Unternehmen, Nemotron-Modelle auf ihrer eigenen Infrastruktur zu inspizieren, anzupassen und bereitzustellen.

Die strategische Berechnung ist transparent, da Open-Source-KI weltweit verbreitet ist.

Da die US-amerikanischen Regierungsbehörden Transparenz fordern, positioniert sich Nvidia als vertrauenswürdiger inländischer Anbieter und stärkt gleichzeitig sein Entwicklerökosystem.

Was Nvidia veröffentlicht hat: Modelle, Daten und technische Angaben

Die Nemotron-3-Familie besteht aus drei Modellen in zunehmender Größe: Nano (30 Milliarden Parameter mit 3 Milliarden aktiv), Super (100 Milliarden mit 10 Milliarden aktiv) und Ultra (500 Milliarden mit 50 Milliarden aktiv).

Nur sofort Nemotron 3 Nano-Schiffe; Super und Ultra erscheinen in der ersten Hälfte des Jahres 2026.

Nvidias Hauptbehauptung ist Effizienz. Nemotron 3 Nano liefert viermal so viel Durchsatz wie sein Vorgänger Nemotron 2 und reduziert die Erzeugung von Reasoning-Tokens um bis zu 60 %.

Die Modelle verwenden eine hybride latente Mischung von Experten-Architektur, ein Design, das nur die relevantesten Rechenwege für jede Aufgabe aktiviert und so nachahmt, wie das menschliche Gehirn Arbeit segmentiert.

Dieser Ansatz ist zum Industriestandard geworden, wobei laut unabhängigen Benchmarking-Daten die Top 10 der intelligentesten Open-Source-Modelle nun MoE verwenden.

Es muss beachtet werden, dass die Menge an Informationen, die ein Modell im Speicher speichern kann, für Nano auf eine Million Token ansteigt, was siebenmal breiter ist als beim Vorgänger.

Das ist wichtig für Langform-Dokumente, Code-Repositorien und komplexe mehrstufige Argumentationen.

Super und Ultra nutzen Nvidias 4-Bit-NVFP4-Trainingsformat auf der Blackwell-Hardware, wodurch Speicherbedarf und Trainingszeit reduziert werden, ohne die Genauigkeit zu beeinträchtigen.

Alle Modellgewichte, Trainingskorpora und detaillierte Rezepte sind auf GitHub und Hugging Face unter der NVIDIA Open Model License verfügbar.

Entwickler erhalten außerdem Zugriff auf NeMo Gym, NeMo RL und NeMo Evaluator, die Open-Source-Bibliotheken für Training, Reinforcement Learning und Sicherheitsvalidierung.

Warum ist Open Release wichtig?

Die offene Veröffentlichung reagiert direkt auf die steigende Nachfrage von Unternehmen nach Modelltransparenz.

"Viele unserer Unternehmenskunden können bestimmte Modelle nicht bereitstellen oder ihr Geschäft auf Modellen mit undurchsichtigen Quellcodes aufbauen", sagte Kari Briski, Nvidias VP für generative KI-Software.

Regulierte Branchen wie Gesundheitswesen, Finanzen und Verteidigung erfordern prüfbare, vor Ort zugängliche Alternativen zu proprietären Systemen, die von ausländischen Akteuren kontrolliert werden.

Nvidias Schritt gewinnt an Kraft, da Meta sich vom Open-Source zurückzieht. Das Wachstum von Llama kam nach dem lauwarmen Llama 4-Start im April zum Stillstand und ließ damit den Konkurrenzmodellen offene Modelle Vorsprung.

Meta hat Trainingsdatensätze sogar von nahen Partnern wie Nvidia zurückgehalten und so gemeinschaftsgetriebene Verbesserungen eingeschränkt.

Im Gegensatz dazu veröffentlicht Nvidia alles: Gewichte, Rezepte und Datensätze. Diese Transparenz könnte Unternehmenskunden und Regierungsaufträge anziehen, die vor undurchsichtigen Abhängigkeiten misstrauisch sind.

Geopolitisch verstärken US-Zölle und Exportbeschränkungen auf chinesische KI Nvidias Vorteil.