Amazon dezvăluie un cip AI revoluționar: va perturba dominația Nvidia?

Amazon dezvăluie un cip AI revoluționar: va perturba dominația Nvidia?
Devesh Kumar
02 dec. 2025, 22:48 P.M.
  • Trainium3 oferă o viteză de 4,4× și o eficiență cu 40% mai bună, reducând costurile de calcul AI cu 50%.
  • UltraServerele includ 144 de cipuri cu 362 FP8 PFLOP și 20,7 TB HBM3e pentru sarcini masive de modele.
  • Amazon vizează economiile de cost și energie pentru a reduce treptat liderul industriei Nvidia, bazat pe ecosistem.

Amazon a lansat oficial Trainium3, cel mai recent cip AI construit la comandă, semnalând o presiune agresivă de a contesta controlul Nvidia pe piața hardware-ului de inteligență artificială.

Noul cip oferă performanțe de 4,4 ori mai mari și o eficiență energetică cu 40% mai mare comparativ cu predecesorul său, în timp ce AWS a lansat simultan Trn3 UltraServere capabile să gestioneze 144 de cipuri într-un singur sistem.

Clienți precum Anthropic, Karakuri și Decart raportează deja reduceri ale costurilor de instruire și inferență de până la 50% folosind Trainium3.

Această mișcare subliniază o tendință mai largă a industriei în care giganții tehnologici dezvoltă siliciu proprietar pentru a reduce dependența de GPU-urile Nvidia și pentru a reduce drastic costurile astronomice ale infrastructurii AI.

Revoluția costurilor: Cum Amazon subminează prețurile Nvidia

Adevărata armă a lui Trainium3 nu este performanța brută; E economie.

Construit pe tehnologie de 3 nanometri, fiecare UltraServer livrează 362 FP8 PFLOP cu până la 20,7 TB de memorie HBM3e, permițând modelelor masive să se antreneze în săptămâni în loc de luni.

Dar unghiul costurilor este ceea ce atrage atenția întreprinderilor. Decart, un startup de generare video AI, deja realizează o inferență de 4 ori mai rapidă pentru generarea video în timp real, la jumătate din costul GPU-urilor Nvidia.

Pentru organizațiile care cheltuiesc lunar milioane pe infrastructura AI, aceasta este economia transformațională.

Strategia Amazon vizează două puncte sensibile. În primul rând, diferența de eficiență energetică: Trainium3 oferă de peste 5 ori mai multe tokenuri de ieșire pe megawatt decât generațiile anterioare, reducând direct facturile de energie ale centrelor de date.

În al doilea rând, costul simbolului. AWS susține că Trainium și TPU-urile Google oferă un cost pe miliard de tokenuri cu 50-70% mai mic comparativ cu clusterele de top Nvidia H100.

Pentru întreprinderile care dezvoltă modele cu trilioane de parametri, economiile cumulative ajung la sute de milioane anual.

Adoptarea timpurie a Anthropic are o greutate simbolică; Amazon deține o participație de 8 miliarde de dolari în rivalul OpenAI, dar a ales Trainium pentru sarcinile de producție.

Acea recomandare semnalează că Trainium3 nu este experimental; este pregătit pentru producție și competitiv cu ofertele de top Nvidia.

Poate Amazon să câștige cu adevărat?

Totuși, șanțul Nvidia rămâne impunător. CUDA, ecosistemul software al Nvidia, a devenit standardul industriei pentru dezvoltarea AI.

Majoritatea cercetătorilor antrenează modele pe CUDA; majoritatea framework-urilor optimizează mai întâi pentru CUDA.

Trecerea la Trainium necesită rescrierea codului, recalificarea echipelor și acceptarea blocării furnizorului cu AWS, o provocare descurajantă pentru companiile care evită riscurile.

Amazon recunoaște această realitate anunțând că Trainium4 va suporta tehnologia de interconectare NVLink Fusion a Nvidia, permițând implementări mixte ale cipurilor Trainium și Nvidia în aceleași rack-uri.

Este o recunoaștere pragmatică că înlocuirea Nvidia peste noapte este imposibilă, dar poziționarea Trainium ca un complement rentabil este realizabilă.

Inerția clienților favorizează, de asemenea, Nvidia. Companiile cu infrastructură GPU existentă, echipe instruite și pipeline-uri optimizate se confruntă cu costuri de comutare pe care câștigurile pure de performanță nu le justifică.

Microsoft, Google și Meta: Cele mai mari ținte ale Trainium, de asemenea, își produc propriile cipuri AI intern, reducând piețele adresabile.

Totuși, startup-urile și întreprinderile sensibile la costuri nu se confruntă cu o astfel de povară a incumbintei.

Karakuri, Metagenomi și Splash Music implementează Trainium la scară largă, sugerând că Amazon poate capta noi sarcini de lucru chiar dacă Nvidia păstrează piața de prestigiu.

Întrebarea reală nu este dacă Amazon poate egala performanța brută a Nvidia; Trainium3 deja are.

Contează dacă doar costul și eficiența energetică remodelează o piață de cipuri AI de 50 miliarde de dolari+ sau dacă blocarea ecosistemului și inerția clienților mențin Nvidia ancorată.