Amazon onthult baanbrekende AI-chip: zal het Nvidia's dominantie verstoren?

Amazon onthult baanbrekende AI-chip: zal het Nvidia's dominantie verstoren?
Devesh Kumar
02 dec 2025, 21:48 P.M.
  • Trainium3 levert 4,4× snelheid en 40% betere efficiëntie, waardoor de AI-rekenkosten tot wel 50% worden verlaagd.
  • UltraServers beschikken over 144 chips met 362 FP8 PFLOPs en 20,7 TB HBM3e voor enorme modelworkloads.
  • Amazon streeft naar kosten- en energiebesparingen om Nvidia's ecosysteemgedreven voorsprong in de industrie af te breken.

Amazon heeft officieel Trainium3 gelanceerd, zijn nieuwste op maat gemaakte AI-chip, wat een agressieve poging aangeeft om Nvidia's greep op de markt voor kunstmatige intelligentiehardware uit te dagen.

De nieuwe chip levert 4,4 keer snellere prestaties en 40% hogere energie-efficiëntie vergeleken met zijn voorganger, terwijl AWS gelijktijdig Trn3 UltraServers uitrolde die 144 chips in één systeem konden verwerken.

Klanten zoals Anthropic, Karakuri en Decart melden al trainings- en inferentiekostenreducties tot 50% via Trainium3.

Deze stap onderstreept een bredere trend in de industrie waarbij techreuzen eigen silicium ontwikkelen om de afhankelijkheid van Nvidia's GPU's te verminderen en de astronomische kosten van AI-infrastructuur te verlagen.

De kostenrevolutie: Hoe Amazon de prijsstelling van Nvidia onderbiedt

Het echte wapen van Trainium3 is geen pure prestatie; Het is economie.

Gebouwd op 3-nanometer technologie, levert elke UltraServer 362 FP8 PFLOPs met maximaal 20,7 TB HBM3e-geheugen, waardoor enorme modellen in weken in plaats van maanden kunnen trainen.

Maar de kostenhoek is wat de aandacht van het bedrijf trekt. Decart, een startup op het gebied van AI-videogeneratie, behaalt al vier keer snellere inferentie voor realtime videogeneratie tegen de helft van de kosten van Nvidia GPU's.

Voor organisaties die maandelijks miljoenen uitgeven aan AI-infrastructuur, is dat transformationele economie.

De strategie van Amazon richt zich op twee pijnpunten. Ten eerste de energie-efficiëntiekloof: Trainium3 levert meer dan 5 keer meer outputtokens per megawatt dan eerdere generaties, waardoor de stroomrekeningen van datacenters direct worden verlaagd.

Ten tweede, tokenkosten. AWS beweert dat Trainium en Google's TPU's 50-70% lagere kosten per miljard tokens bieden vergeleken met high-end Nvidia H100-clusters.

Voor ondernemingen die biljoenmodellen trainen, bereiken de cumulatieve besparingen jaarlijks honderden miljoenen.

De vroege adoptie van Anthropic draagt symbolische betekenis; Amazon bezit een belang van 8 miljard dollar in de rivaal van OpenAI, maar koos voor Trainium voor productieworkloads.

Die endorsement geeft aan dat Trainium3 niet experimenteel is; het is productieklaar en concurrerend met Nvidia's vlaggenschipproducten.

Kan Amazon eigenlijk winnen?

Toch blijft de gracht van Nvidia indrukwekkend. CUDA, Nvidia's software-ecosysteem, is de industriestandaard geworden voor AI-ontwikkeling.

De meeste onderzoekers trainen modellen op CUDA; de meeste frameworks optimaliseren eerst voor CUDA.

Overstappen naar Trainium vereist het herschrijven van code, het hertrainen van teams en het accepteren van vendor lock-in met AWS, een ontmoedigende uitdaging voor risicomijdende ondernemingen.

Amazon erkent deze realiteit door aan te kondigen dat Trainium4 Nvidia's NVLink Fusion interconnect-technologie zal ondersteunen, waardoor gemengde implementaties van Trainium- en Nvidia-chips binnen dezelfde racks mogelijk worden.

Het is een pragmatische erkenning dat het onmogelijk is om Nvidia van de ene op de andere dag te vervangen, maar dat het mogelijk is om Trainium als kosteneffectieve aanvulling te positioneren.

De traagheid van de klant is ook gunstig voor Nvidia. Ondernemingen met bestaande GPU-infrastructuur, getrainde teams en geoptimaliseerde pipelines hebben switchkosten die puur prestatieverbeteringen niet rechtvaardigen.

Microsoft, Google en Meta: Trainium's grootste doelwitten produceren ook intern hun eigen AI-chips, waardoor adresserbare markten worden verminderd.

Toch ondervinden startups en kostengevoelige ondernemingen geen dergelijke incumbency last.

Karakuri, Metagenomi en Splash Music zetten Trainium op grote schaal uit, wat suggereert dat Amazon nieuwe workloads kan veroveren, zelfs als Nvidia de prestigemarkt behoudt.

De echte vraag is niet of Amazon de ruwe prestaties van Nvidia kan evenaren; Trainium3 doet dat al.

Het gaat erom of kosten en energie-efficiëntie alleen al een AI-chipmarkt van $50 miljard+ hervormen, of dat ecosysteem-lock-in en klantinertie Nvidia stevig in de grond houden.