Amazon revela chip de IA revolucionário: será que ele vai acabar com o domínio da Nvidia?

Amazon revela chip de IA revolucionário: será que ele vai acabar com o domínio da Nvidia?
Devesh Kumar
02 de dez. de 2025, 17:48 PM
  • Trainium3 oferece 4,4× de velocidade e 40% mais eficiência, reduzindo os custos de computação de IA para 50%.
  • Os UltraServers carregam 144 chips com 362 FP8 PFLOPs e 20,7 TB HBM3e para cargas de trabalho massivas de modelos.
  • A Amazon mira a economia de custos e energia para reduzir a liderança da Nvidia no setor orientado por ecossistemas.

A Amazon lançou oficialmente o Trainium3, seu mais novo chip de IA personalizado, sinalizando um esforço agressivo para desafiar a posição da Nvidia no mercado de hardware de inteligência artificial.

O novo chip oferece desempenho 4,4 vezes maior e 40% maior eficiência energética em comparação ao seu antecessor, enquanto a AWS lançou simultaneamente UltraServers Trn3 capazes de lidar com 144 chips em um único sistema.

Clientes como Anthropic, Karakuri e Decart já relatam reduções de custos de treinamento e inferência de até 50% usando o Trainium3.

A medida ressalta uma tendência mais ampla do setor de gigantes tecnológicos desenvolvendo silício proprietário para reduzir a dependência das GPUs da Nvidia e diminuir drasticamente os custos astronômicos da infraestrutura de IA.

A revolução dos custos: Como a Amazon está prejudicando os preços da Nvidia

A verdadeira arma de Trainium3 não é o desempenho bruto; É economia.

Construído sobre tecnologia de 3 nanômetros, cada UltraServer entrega 362 PFLOPs FP8 com até 20,7 TB de memória HBM3e, permitindo que modelos massivos treinem em semanas em vez de meses.

Mas o que chama a atenção das empresas é o lado do custo. A Decart, uma startup de geração de vídeo com IA, já está alcançando inferência 4x mais rápida para geração de vídeo em tempo real a metade do custo das GPUs Nvidia.

Para organizações que gastam milhões mensalmente em infraestrutura de IA, isso é economia transformadora.

A estratégia da Amazon mira dois pontos problemáticos. Primeiro, a lacuna de eficiência energética: o Trainium3 entrega mais de 5 vezes mais tokens de saída por megawatt do que as gerações anteriores, reduzindo diretamente as contas de energia dos datacenters.

Segundo, o custo do token. A AWS afirma que a Trainium e as TPUs do Google oferecem custo por bilhão de tokens 50-70% menor em comparação com clusters Nvidia H100 de alto desempenho.

Para empresas que treinam modelos de trilhões de parâmetros, as economias acumuladas chegam a centenas de milhões anualmente.

A adoção precoce de Anthropic carrega peso simbólico; A Amazon detém uma participação de 8 bilhões de dólares no rival da OpenAI, mas escolheu a Trainium para cargas de produção.

Esse endosso indica que o Trainium3 não é experimental; está pronto para produção e é competitivo com as principais ofertas da Nvidia.

Será que a Amazon realmente pode vencer?

Ainda assim, o fosso da Nvidia continua formidável. A CUDA, o ecossistema de software da Nvidia, tornou-se o padrão da indústria para o desenvolvimento de IA.

A maioria dos pesquisadores treina modelos no CUDA; a maioria dos frameworks otimiza primeiro para CUDA.

Migrar para o Trainium exige reescrever código, requalificar equipes e aceitar o lock-in do fornecedor com a AWS, uma proposta desafiadora para empresas avessas ao risco.

A Amazon reconhece essa realidade ao anunciar que o Trainium4 suportará a tecnologia de interconexão NVLink Fusion da Nvidia, permitindo implantações mistas dos chips Trainium e Nvidia nos mesmos racks.

É uma admissão pragmática que substituir a Nvidia da noite para o dia é impossível, mas posicionar o Trainium como um complemento econômico é alcançável.

A inércia do cliente também favorece a Nvidia. Empresas com infraestrutura de GPU já existente, equipes treinadas e pipelines otimizados enfrentam custos de troca que ganhos puros de desempenho não justificam.

Microsoft, Google e Meta: Os maiores alvos da Trainium também fabricam internamente seus próprios chips de IA, reduzindo mercados de endereços.

Ainda assim, startups e empresas sensíveis a custos não enfrentam esse ônus de incumbência.

Karakuri, Metagenomi e Splash Music estão lançando o Trainium em larga escala, sugerindo que a Amazon pode capturar novas cargas de trabalho mesmo que a Nvidia mantenha o mercado de prestígio.

A verdadeira questão não é se a Amazon consegue igualar o desempenho bruto da Nvidia; Trainium3 já tem.

A questão é se o custo e a eficiência energética sozinhos remodelam um mercado de chips de IA de US$ 50 bilhões+, ou se o bloqueio do ecossistema e a inércia do cliente mantêm a Nvidia consolidada.