Amazon dévoile une puce IA révolutionnaire : va-t-elle bouleverser la domination de Nvidia ?

Amazon dévoile une puce IA révolutionnaire : va-t-elle bouleverser la domination de Nvidia ?
Devesh Kumar
02 déc. 2025, 21:48 PM
  • Trainium3 offre 4,4 × de vitesse et 40 % d’efficacité supérieure, réduisant les coûts de calcul de l’IA à 50 %.
  • Les UltraServers contiennent 144 puces avec 362 PFLOP FP8 et 20,7 To de HBM3e pour des charges de travail massives de modèles.
  • Amazon vise les économies de coûts et d’énergie pour réduire progressivement le leader de Nvidia dans l’industrie axé sur l’écosystème.

Amazon a officiellement lancé Trainium3, sa dernière puce IA conçue sur mesure, marquant une poussée agressive pour remettre en question la prise de Nvidia sur le marché du matériel d’intelligence artificielle.

La nouvelle puce offre des performances 4,4 fois supérieures et une efficacité énergétique supérieure de 40 % par rapport à son prédécesseur, tandis qu’AWS a simultanément déployé des UltraServers Trn3 capables de gérer 144 puces dans un seul système.

Des clients comme Anthropic, Karakuri et Decart rapportent déjà des réductions de coûts de formation et d’inférence allant jusqu’à 50 % grâce à Trainium3.

Cette décision met en lumière une tendance plus large de l’industrie : les géants technologiques développent du silicium propriétaire pour réduire la dépendance aux GPU Nvidia et diminuer les coûts astronomiques de l’infrastructure IA.

La révolution des coûts : comment Amazon assombrit les prix de Nvidia

La véritable arme de Trainium3 n’est pas la performance brute ; C’est l’économie.

Construit sur une technologie 3 nanomètres, chaque UltraServer délivre 362 FP8 PFLOP avec jusqu’à 20,7 To de mémoire HBM3e, permettant aux modèles massifs de s’entraîner en semaines plutôt que en mois.

Mais c’est l’angle du coût qui attire l’attention des entreprises. Decart, une startup de génération vidéo par IA, réalise déjà une inférence 4 fois plus rapide pour la génération vidéo en temps réel, à moitié coût par rapport aux GPU Nvidia.

Pour les organisations qui dépensent des millions chaque mois dans l’infrastructure IA, c’est l’économie transformationnelle.

La stratégie d’Amazon vise deux points sensibles. Premièrement, l’écart d’efficacité énergétique : Trainium3 offre plus de 5 fois plus de jetons de sortie par mégawatt que les générations précédentes, réduisant directement les factures d’électricité des centres de données.

Deuxièmement, le coût des jetons. AWS affirme que Trainium et les TPU de Google offrent un coût par milliard de tokens inférieur de 50 à 70 % par rapport aux clusters haut de gamme Nvidia H100.

Pour les entreprises qui développent des modèles à un billion de paramètres, les économies cumulées atteignent des centaines de millions chaque année.

L’adoption précoce d’Anthropic a un poids symbolique ; Amazon détient une participation de 8 milliards de dollars dans le rival d’OpenAI, mais a choisi Trainium pour la production de charges.

Cette approbation indique que Trainium3 n’est pas expérimental ; il est prêt à la production et compétitif avec les modèles phares de Nvidia.

Amazon peut-il vraiment gagner ?

Pourtant, le fossé de Nvidia reste redoutable. CUDA, l’écosystème logiciel de Nvidia, est devenu la norme industrielle pour le développement de l’IA.

La plupart des chercheurs entraînent des modèles sur CUDA ; la plupart des frameworks optimisent d’abord pour CUDA.

Passer à Trainium nécessite de réécrire le code, de reformer les équipes et d’accepter l’engagement fournisseur avec AWS, une entreprise intimidante pour les entreprises prudentes.

Amazon reconnaît cette réalité en annonçant que Trainium4 prendra en charge la technologie d’interconnexion NVLink Fusion de Nvidia, permettant des déploiements mixtes de puces Trainium et Nvidia dans les mêmes racks.

C’est une admission pragmatique que remplacer Nvidia du jour au lendemain est impossible, mais positionner Trainium comme un complément rentable est réalisable.

L’inertie client favorise également Nvidia. Les entreprises disposant d’une infrastructure GPU existante, d’équipes formées et de pipelines optimisés sont confrontées à des coûts de commutation que les gains de performance purs ne justifient pas.

Microsoft, Google et Meta : Les plus grandes cibles de Trainium fabriquent également leurs propres puces IA en interne, réduisant ainsi les marchés adressables.

Pourtant, les startups et les entreprises sensibles aux coûts ne font pas face à ce fardeau d’incumbence.

Karakuri, Metagenomi et Splash Music déploient Trainium à grande échelle, ce qui suggère qu’Amazon peut capter de nouvelles charges de travail même si Nvidia conserve le marché prestigieux.

La vraie question n’est pas de savoir si Amazon peut égaler les performances brutes de Nvidia ; Trainium3 le fait déjà.

Il s’agit de savoir si le coût et l’efficacité énergétique à eux seuls transforment un marché des puces IA de 50 milliards de dollars, ou si l’encroiement de l’écosystème et l’inertie client maintiennent Nvidia ancrée.