Invezz

Amazon stellt einen bahnbrechenden KI-Chip vor: Wird er Nvidias Dominanz stören?

Amazon stellt einen bahnbrechenden KI-Chip vor: Wird er Nvidias Dominanz stören?
Devesh Kumar
02. Dez. 2025, 21:48 PM
  • Trainium3 liefert 4,4 × Geschwindigkeit und 40 % bessere Effizienz und senkt die KI-Rechenkosten um bis zu 50 %.
  • UltraServers verfügen über 144 Chips mit 362 FP8 PFLOPs und 20,7 TB HBM3e für riesige Modell-Workloads.
  • Amazon strebt Kosten- und Energieeinsparungen an, um Nvidias ökosystemgetriebene Branchenführung abzubauen.

Amazon hat offiziell Trainium3 auf den Markt gebracht, seinen neuesten maßgeschneiderten KI-Chip, was einen aggressiven Vorstoß signalisiert, um Nvidias Einfluss auf den Markt für künstliche Intelligenz-Hardware herauszufordern.

Der neue Chip liefert 4,4-mal schnellere Leistung und 40 % höhere Energieeffizienz im Vergleich zum Vorgänger, während AWS gleichzeitig Trn3 UltraServer einführte, die 144 Chips in einem System verarbeiten können.

Kunden wie Anthropic, Karakuri und Decart berichten bereits von Trainings- und Inferenzkostenreduktionen von bis zu 50 % mit Trainium3.

Dieser Schritt unterstreicht einen breiteren Branchentrend, bei dem Technologieriesen proprietäres Silizium entwickeln, um die Abhängigkeit von Nvidias GPUs zu verringern und die astronomischen Kosten der KI-Infrastruktur zu senken.

Die Kostenrevolution: Wie Amazon Nvidias Preisgestaltung unterbietet

Die eigentliche Waffe von Trainium3 ist nicht rohe Leistung; Es ist Wirtschaft.

Jeder UltraServer basiert auf 3-Nanometer-Technologie und liefert 362 FP8 PFLOPs mit bis zu 20,7 TB HBM3e-Speicher, sodass riesige Modelle in Wochen statt Monaten trainieren können.

Doch der Kostenaspekt ist es, der die Aufmerksamkeit des Unternehmens auf sich zieht. Decart, ein Startup zur KI-Videogeneration, erreicht bereits viermal so schnellere Inferenz für die Echtzeit-Videogenerierung zu halben Kosten wie Nvidia-GPUs.

Für Organisationen, die monatlich Millionen für KI-Infrastruktur ausgeben, ist das transformative Ökonomie.

Amazons Strategie richtet sich auf zwei Schmerzpunkte. Zunächst die Energieeffizienzlücke: Trainium3 liefert mehr als fünfmal mehr Ausgangstoken pro Megawatt als frühere Generationen und senkt damit direkt die Stromrechnungen der Rechenzentren.

Zweitens: Token-Kosten. AWS behauptet, dass Trainium und Googles TPUs 50–70 % niedrigere Kosten pro Milliarde Token bieten als hochwertige Nvidia H100-Cluster.

Für Unternehmen, die Billionen-Parameter-Modelle ausbilden, erreichen die kumulierten Einsparungen jährlich Hunderte von Millionen.

Anthropics frühe Übernahme hat symbolisches Gewicht; Amazon hält einen Anteil von 8 Milliarden US-Dollar am Konkurrenten von OpenAI, entschied sich jedoch für Produktionsworkloads für Trainium.

Diese Unterstützung signalisiert, dass Trainium3 nicht experimentell ist; es ist produktionsreif und wettbewerbsfähig mit Nvidias Flaggschiff-Angeboten.

Kann Amazon tatsächlich gewinnen?

Dennoch bleibt Nvidias Wassergraben beeindruckend. CUDA, Nvidias Software-Ökosystem, ist zum Industriestandard für KI-Entwicklung geworden.

Die meisten Forscher trainieren Modelle auf CUDA; die meisten Frameworks optimieren zuerst für CUDA.

Der Wechsel zu Trainium erfordert das Umschreiben von Code, das Umschulen von Teams und die Akzeptanz der Lieferantenbindung bei AWS – eine entmutigende Aufgabe für risikoscheue Unternehmen.

Amazon erkennt diese Realität an, indem es ankündigt, dass Trainium4 Nvidias NVLink Fusion Interconnect-Technologie unterstützen wird, was gemischte Einsätze von Trainium- und Nvidia-Chips in denselben Racks ermöglicht.

Es ist ein pragmatisches Eingeständnis, dass ein Ersatz von Nvidia über Nacht unmöglich ist, aber Trainium als kosteneffizientes Ergänzungsmittel zu positionieren ist machbar.

Auch die Kundenträgheit bevorzugt Nvidia. Unternehmen mit bestehender GPU-Infrastruktur, geschulten Teams und optimierten Pipelines stehen vor Switching-Kosten, die reine Leistungssteigerungen nicht rechtfertigen.

Microsoft, Google und Meta: Trainiums größte Ziele stellen ebenfalls eigene KI-Chips intern her, wodurch adressierbare Märkte reduziert werden.

Dennoch haben Start-ups und kostensensible Unternehmen keine derartige Belastung.

Karakuri, Metagenomi und Splash Music setzen Trainium in großem Maßstab ein, was darauf hindeutet, dass Amazon auch dann neue Workloads erschließen kann, wenn Nvidia den Prestigemarkt behält.

Die eigentliche Frage ist nicht, ob Amazon Nvidias rohe Leistung erreichen kann; Trainium3 tut das bereits.

Es geht darum, ob Kosten und Energieeffizienz allein einen KI-Markt im Wert von 50 Milliarden Dollar umgestalten oder ob Ökosystem-Lock-in und Kundenträgheit Nvidia festhalten.