Amazon presenta un chip AI rivoluzionario: sconvolgerà il dominio di Nvidia?

Amazon presenta un chip AI rivoluzionario: sconvolgerà il dominio di Nvidia?
Devesh Kumar
02 dic 2025, 21:48 PM
  • Trainium3 offre una velocità del 4,4× e un'efficienza migliorata del 40%, riducendo i costi di calcolo dell'IA al 50%.
  • Gli UltraServer impacchettano 144 chip con 362 FP8 PFLOP e 20,7 TB HBM3e per carichi di lavoro massicci di modelli.
  • Amazon mira a risparmiare costi ed energia per ridurre gradualmente il leader di Nvidia nel settore guidato dall'ecosistema.

Amazon ha ufficialmente lanciato Trainium3, il suo ultimo chip AI costruito su misura, segnalando una spinta aggressiva a sfidare la presa di Nvidia sul mercato dell'hardware per intelligenza artificiale.

Il nuovo chip offre prestazioni 4,4 volte superiori e un'efficienza energetica superiore del 40% rispetto al suo predecessore, mentre AWS ha contemporaneamente lanciato Trn3 UltraServer capaci di gestire 144 chip in un unico sistema.

Clienti come Anthropic, Karakuri e Decart stanno già segnalando riduzioni nei costi di formazione e inferenza fino al 50% utilizzando Trainium3.

La mossa sottolinea una tendenza più ampia del settore in cui i giganti tecnologici sviluppano silici proprietari per ridurre la dipendenza dalle GPU Nvidia e ridurre drasticamente i costi astronomici dell'infrastruttura di IA.

La rivoluzione dei costi: come Amazon sta superando i prezzi di Nvidia

La vera arma di Trainium3 non è la prestazione pura; È economia.

Basato su tecnologia a 3 nanometri, ogni UltraServer offre 362 PFLOP FP8 con fino a 20,7 TB di memoria HBM3e, permettendo ai modelli di grandi dimensioni di addestrarsi in settimane invece che in mesi.

Ma è proprio l'aspetto dei costi che cattura l'attenzione delle imprese. Decart, una startup di generazione video con IA, sta già raggiungendo inferenze 4 volte più veloci per la generazione video in tempo reale a metà del costo delle GPU Nvidia.

Per le organizzazioni che spendono milioni mensilmente per infrastrutture di IA, questa è economia trasformativa.

La strategia di Amazon mira a due punti dolenti. Innanzitutto, il divario di efficienza energetica: Trainium3 offre oltre 5 volte più token di output per megawatt rispetto alle generazioni precedenti, riducendo direttamente le bollette elettriche dei data center.

Secondo, il costo dei gettoni. AWS afferma che Trainium e i TPU di Google offrono un costo per miliardo di token inferiore dal 50 al 70% rispetto ai cluster Nvidia H100 di fascia alta.

Per le imprese che formano modelli a trilioni di parametri, il risparmio cumulativo raggiunge centinaia di milioni all'anno.

L'adozione precoce di Anthropic ha un peso simbolico; Amazon detiene una quota di 8 miliardi di dollari nel rivale di OpenAI, ma ha scelto Trainium per i carichi di lavoro di produzione.

Questa approvazione segnala che Trainium3 non è sperimentale; è pronto per la produzione e competitivo rispetto alle offerte di punta di Nvidia.

Amazon può davvero vincere?

Eppure il fossato di Nvidia rimane imponente. CUDA, l'ecosistema software di Nvidia, è diventato lo standard del settore per lo sviluppo dell'IA.

La maggior parte dei ricercatori addestra modelli su CUDA; la maggior parte dei framework ottimizza prima per CUDA.

Passare a Trainium richiede riscrivere codice, riformare i team e accettare il vendor-in con AWS, una proposta ardua per le imprese avverse al rischio.

Amazon riconosce questa realtà annunciando che Trainium4 supporterà la tecnologia di interconnessione NVLink Fusion di Nvidia, permettendo implementazioni miste di chip Trainium e Nvidia all'interno degli stessi rack.

È un'ammissione pragmatica che sostituire Nvidia da un giorno all'altro sia impossibile, ma posizionare Trainium come un complemento economico è realizzabile.

L'inerzia del cliente favorisce anche Nvidia. Le aziende con infrastruttura GPU esistente, team formati e pipeline ottimizzate si trovano ad affrontare costi di cambio che i puri guadagni di prestazioni non giustificano.

Microsoft, Google e Meta: I maggiori obiettivi di Trainium producono anche internamente i propri chip di intelligenza artificiale, riducendo i mercati indirizzabili.

Tuttavia, le startup e le imprese sensibili ai costi non affrontano tale onere di incumbency.

Karakuri, Metagenomi e Splash Music stanno implementando Trainium su larga scala, suggerendo che Amazon può conquistare nuovi carichi di lavoro anche se Nvidia mantiene il mercato di prestigio.

La vera domanda non è se Amazon possa eguagliare le prestazioni grezze di Nvidia; Trainium3 lo fa già.

La questione è se costi ed efficienza energetica da soli rimodelleranno un mercato dei chip AI da 50 miliardi di dollari+, oppure se il lock-in dell'ecosistema e l'inerzia del cliente mantengono Nvidia ben radicata.