Amazon melancarkan cip AI yang mengubah permainan: adakah ia akan mengganggu penguasaan Nvidia?

Amazon melancarkan cip AI yang mengubah permainan: adakah ia akan mengganggu penguasaan Nvidia?
Devesh Kumar
03 Dis 2025, 04:48 PG
  • Trainium3 memberikan kelajuan 4.4× dan kecekapan 40% lebih baik, mengurangkan kos pengiraan AI sehingga 50%.
  • UltraServers membungkus 144 cip dengan 362 FP8 PFLOPs dan 20.7 TB HBM3e untuk beban kerja model yang besar.
  • Amazon menyasarkan penjimatan kos dan tenaga untuk mengurangkan peneraju industri dipacu ekosistem Nvidia.

Amazon telah melancarkan Trainium3 secara rasmi, cip AI terbaharu yang dibina khasnya, menandakan dorongan agresif untuk mencabar cengkaman Nvidia dalam pasaran perkakasan kecerdasan buatan.

Cip baharu ini memberikan prestasi 4.4x lebih pantas dan kecekapan tenaga 40% lebih besar berbanding pendahulunya, manakala AWS secara serentak melancarkan Trn3 UltraServer yang mampu mengendalikan 144 cip dalam satu sistem.

Pelanggan seperti Anthropic, Karakuri dan Decart sudah melaporkan pengurangan kos latihan dan inferens sehingga 50% menggunakan Trainium3.

Langkah itu menggariskan trend industri yang lebih luas bagi gergasi teknologi yang membangunkan silikon proprietari untuk mengurangkan pergantungan pada GPU Nvidia dan mengurangkan perbelanjaan astronomi infrastruktur AI.

Revolusi kos: Bagaimana Amazon mengurangkan harga Nvidia

Senjata sebenar Trainium3 bukanlah prestasi mentah; ia ekonomi.

Dibina di atas teknologi 3-nanometer, setiap UltraServer menyampaikan 362 PFLOP FP8 dengan memori HBM3e sehingga 20.7 TB, membolehkan model besar-besaran berlatih dalam beberapa minggu dan bukannya bulan.

Tetapi sudut kos adalah apa yang menarik perhatian perusahaan. Decart, permulaan penjanaan video AI, sudah mencapai inferens 4x lebih pantas untuk penjanaan video masa nyata pada separuh kos GPU Nvidia.

Bagi organisasi yang membelanjakan berjuta-juta setiap bulan untuk infrastruktur AI, itu adalah ekonomi transformasi.

Strategi Amazon menyasarkan dua titik kesakitan. Pertama, jurang kecekapan tenaga: Trainium3 menyampaikan lebih 5x lebih banyak token output setiap megawatt daripada generasi sebelumnya, secara langsung mengurangkan bil kuasa pusat data.

Kedua, kos token. AWS mendakwa Trainium dan TPU Google menawarkan kos setiap bilion token 50-70% lebih rendah berbanding kluster Nvidia H100 mewah.

Bagi perusahaan yang melatih model trilion parameter, penjimatan kumulatif mencecah ratusan juta setiap tahun.

Penggunaan awal Anthropic membawa berat simbolik; Amazon memegang kepentingan $8 bilion dalam saingan OpenAI, namun memilih Trainium untuk beban kerja pengeluaran.

Sokongan itu memberi isyarat Trainium3 bukan eksperimen; ia sedia pengeluaran dan berdaya saing dengan tawaran utama Nvidia.

Bolehkah Amazon benar-benar menang?

Namun parit Nvidia kekal menggerunkan. CUDA, ekosistem perisian Nvidia, telah menjadi standard industri untuk pembangunan AI.

Kebanyakan penyelidik melatih model pada CUDA; kebanyakan rangka kerja mengoptimumkan untuk CUDA terlebih dahulu.

Beralih kepada Trainium memerlukan penulisan semula kod, melatih semula pasukan dan menerima penguncian vendor dengan AWS, cadangan yang menakutkan untuk perusahaan yang mengelak risiko.

Amazon mengakui realiti ini dengan mengumumkan Trainium4 akan menyokong teknologi interkoneksi NVLink Fusion Nvidia, membolehkan penggunaan campuran cip Trainium dan Nvidia dalam rak yang sama.

Ia adalah pengakuan pragmatik bahawa menggantikan Nvidia dalam sekelip mata adalah mustahil, tetapi meletakkan Trainium sebagai pelengkap kos efektif boleh dicapai.

Inersia pelanggan juga memihak kepada Nvidia. Perusahaan dengan infrastruktur GPU sedia ada, pasukan terlatih dan saluran paip yang dioptimumkan menghadapi kos penukaran yang tidak dibenarkan oleh keuntungan prestasi tulen.

Microsoft, Google dan Meta: Sasaran terbesar Trainium, juga mengeluarkan cip AI mereka sendiri secara dalaman, mengurangkan pasaran yang boleh dialamatkan.

Namun, syarikat permulaan dan perusahaan sensitif kos tidak menghadapi beban penyandang sedemikian.

Karakuri, Metagenomi dan Splash Music menggunakan Trainium pada skala, mencadangkan Amazon boleh menangkap beban kerja baharu walaupun Nvidia mengekalkan pasaran prestij.

Persoalan sebenar bukanlah sama ada Amazon boleh menandingi prestasi mentah Nvidia; Trainium3 sudah melakukannya.

Ia sama ada kos dan kecekapan tenaga sahaja membentuk semula pasaran cip AI bernilai $50 bilion+, atau sama ada penguncian ekosistem dan inersia pelanggan memastikan Nvidia berakar umbi.