Amazon prezentuje przełomowy układ AI: czy zakłóci dominację Nvidii?

Amazon prezentuje przełomowy układ AI: czy zakłóci dominację Nvidii?
Devesh Kumar
02 gru 2025, 21:48 PM
  • Trainium3 zapewnia prędkość 4,4× i o 40% lepszą wydajność, obniżając koszty obliczeń AI nawet o 50%.
  • UltraServers ma 144 układy z 362 FP8 PFLOP i 20,7 TB HBM3e dla ogromnych obciążeń modelarskich.
  • Amazon celuje w oszczędności kosztów i energii, aby stopniowo ograniczać przewagę Nvidii opartą na ekosystemie w branży.

Amazon oficjalnie wprowadził na rynek Trainium3, swój najnowszy własnoręcznie zbudowany układ AI, sygnalizując zdecydowaną próbę zakwestionowania pozycji Nvidii na rynku sprzętu sztucznej inteligencji.

Nowy układ zapewnia 4,4 razy szybszą wydajność i o 40% większą efektywność energetyczną w porównaniu do poprzednika, a jednocześnie AWS wprowadził UltraServery Trn3 zdolne do obsługi 144 układów w jednym systemie.

Klienci tacy jak Anthropic, Karakuri i Decart już zgłaszają obniżki kosztów szkoleń i wnioskowania sięgające nawet 50% dzięki wykorzystaniu Trainium3.

Ten ruch podkreśla szerszy trend branżowy, w którym giganci technologiczni opracowują własny krzem, aby zmniejszyć zależność od GPU Nvidii i drastycznie ograniczyć astronomiczne koszty infrastruktury AI.

Rewolucja kosztowa: Jak Amazon podcina ceny Nvidii

Prawdziwą bronią Trainium3 nie jest czysta wydajność; To ekonomia.

Oparty na technologii 3-nanometrowej, każdy UltraServer dostarcza 362 FP8 PFLOP z pamięcią do 20,7 TB, co pozwala na trenowanie ogromnych modeli w tygodniach zamiast miesiącach.

To właśnie aspekt kosztów przyciąga uwagę przedsiębiorstw. Decart, startup zajmujący się generowaniem wideo AI, już osiąga 4x szybszą inferencję dla generowania wideo w czasie rzeczywistym za połowę kosztów GPU Nvidia.

Dla organizacji wydających miliony miesięcznie na infrastrukturę AI to ekonomia transformacyjna.

Strategia Amazona skupia się na dwóch problemach. Po pierwsze, luka w efektywności energetycznej: Trainium3 dostarcza ponad 5 razy więcej tokenów wyjściowych na megawat niż poprzednie generacje, bezpośrednio obniżając rachunki za energię w centrach danych.

Po drugie, koszt symboliczny. AWS twierdzi, że TPU Trainium i Google oferują o 50-70% niższy koszt na miliard tokenów w porównaniu do klastrów wysokiej klasy Nvidia H100.

W przypadku przedsiębiorstw trenujących modele o bilionie parametrów skumulowane oszczędności sięgają setek milionów rocznie.

Wczesne przyjęcie przez Anthropic niesie ze sobą znaczenie symboliczne; Amazon posiada udziały w konkurencji OpenAI o wartości 8 miliardów dolarów, a jednak wybrał Trainium do zadań produkcyjnych.

To poparcie sygnalizuje, że Trainium3 nie jest eksperymentalne; jest gotowy do produkcji i konkurencyjny na tle flagowych modeli Nvidii.

Czy Amazon faktycznie może wygrać?

Mimo to Nvidia wciąż ma ogromny wpływ. CUDA, ekosystem oprogramowania Nvidii, stał się branżowym standardem w tworzeniu AI.

Większość badaczy trenuje modele na CUDA; większość frameworków najpierw optymalizuje pod kątem CUDA.

Przejście na Trainium wymaga przepisywania kodu, przeszkolenia zespołów oraz akceptacji uzależnienia od dostawcy w AWS, co jest trudnym zadaniem dla przedsiębiorstw unikających ryzyka.

Amazon uznaje tę rzeczywistość, ogłaszając, że Trainium4 będzie wspierać technologię połączeń NVLink Fusion firmy Nvidia, umożliwiając mieszane wdrożenia układów Trainium i Nvidia w tych samych szafach.

To pragmatyczne przyznanie, że wymiana Nvidii z dnia na dzień jest niemożliwa, ale pozycjonowanie Trainium jako opłacalnego uzupełnienia jest możliwe.

Inercja klienta również sprzyja Nvidii. Przedsiębiorstwa posiadające istniejącą infrastrukturę GPU, przeszkolone zespoły i zoptymalizowane potoki ponoszą koszty przełączania, których same zyski wydajności nie uzasadniają.

Microsoft, Google i Meta: Największe cele Trainium, produkują także własne układy AI wewnętrznie, ograniczając rynek adresowalny.

Mimo to startupy i przedsiębiorstwa wrażliwe na koszty nie mają takiego obciążenia ugruntowania.

Karakuri, Metagenomi i Splash Music wdrażają Trainium na dużą skalę, co sugeruje, że Amazon może przejąć nowe obciążenia nawet jeśli Nvidia zachowa prestiżowy rynek.

Prawdziwe pytanie nie brzmi, czy Amazon dorówna surowej wydajności Nvidii; Trainium3 już to robi.

Chodzi o to, czy same koszty i efektywność energetyczna zmienią rynek chipów AI wart 50 miliardów dolarów, czy też blokada ekosystemu i inercja klienta utrzymają Nvidię na umocnieniu.