Perlumbaan AI semakin panas: Model manakah yang akan mendominasi?

Perlumbaan AI semakin panas: Model manakah yang akan mendominasi?
Dionysis Partsinevelos
19 Nov 2025, 18:28 PTG
  • Google, OpenAI dan Anthropic mempercepatkan perlumbaan AI dengan model baharu dan tawaran berbilion dolar.
  • Pertumbuhan, ejen dan pengedaran inferens kini lebih penting daripada saiz model.
  • NVIDIA menghadapi tekanan margin jangka panjang apabila hyperscaler mengembangkan silikon tersuai.

Kemajuan dalam AI tiba lebih cepat daripada pengguna boleh menjejakinya.

Keluaran Google Gemini 3, perkongsian berbilion dolar di sekitar Claude Anthropic dan kemas kini baharu daripada OpenAI telah memadatkan kemajuan bertahun-tahun ke dalam satu musim.

Setiap syarikat teknologi utama bertaruh pada model yang lebih besar, cip baharu dan pengembangan awan yang agresif.

Tetapi isu sebenar ialah sama ada model yang lebih baik mencukupi untuk menangkap berbilion pengguna, mendawat semula keseluruhan industri dan menyokong jangkaan ekonomi yang diletakkan pada ledakan AI.

Pasaran berkembang lebih cepat daripada jangkaan

AI kini berkembang daripada teknologi pakar dan merebak ke dalam penjagaan kesihatan, runcit, kewangan, pengiklanan dan operasi perusahaan.

Bloomberg Intelligence mengunjurkan bahawa AI generatif sahaja boleh menjana sekitar $1.8 trilion dalam hasil tahunan menjelang 2032, bersamaan dengan sehingga 16% daripada perbelanjaan teknologi global.

Ini disertai dengan peralihan dalam infrastruktur.

Beban kerja AI sudah mewakili lebih daripada 20% daripada hasil pelayan global, dengan ramalan menunjukkan kepada 40% pada tahun-tahun akan datang.

Sektor ini juga menjejaskan permintaan perkakasan. Melatih model besar mencipta lonjakan pertama dalam perbelanjaan, tetapi inferens, penggunaan harian AI dalam aplikasi sebenar, menjadi pemacu yang lebih gigih.

Perubahan ini penting kerana beban kerja inferens tidak tiba dalam gelombang.

Mereka berjalan secara berterusan dalam sistem perkhidmatan pelanggan, alat produktiviti, enjin pengiklanan dan pembantu pengekodan.

Perniagaan melihat ini sebagai permulaan kitaran infrastruktur yang panjang dan bukannya lonjakan ringkas yang terikat dengan segelintir makmal penyelidikan.

Bolehkah Gemini menangkap ChatGPT?

Google baru sahaja mengumumkan pelancaran Gemini 3, dan ia menunjukkan betapa sengitnya persaingan itu.

Gemini 3 mencatatkan markah rekod pada penanda aras penaakulan utama dan memperkenalkan keupayaan pengekodan dan ejen baharu.

Model ini disepadukan terus ke dalam Carian, apl Gemini, Workspace dan Mod AI Google.

Google melaporkan 650 juta pengguna aktif bulanan untuk Gemini dan lebih 2 bilion untuk Gambaran Keseluruhan AI dalam Carian.

Di atas kertas, ini memberikan syarikat jejak pengedaran yang sepadan atau bahkan melebihi ChatGPT.

Walau bagaimanapun, menambah baik model tidak sama dengan mengubah tingkah laku pengguna.

ChatGPT baru-baru ini mencapai 800 juta pengguna mingguan dan kekal sebagai antara muka AI yang paling biasa bagi ramai orang.

Kekuatan produk bukan sekadar model di belakangnya tetapi ekosistem di sekelilingnya.

Berjuta-juta orang menggunakan ChatGPT di dalam GitHub Copilot, Windows, Microsoft 365 dan berpuluh-puluh alatan pihak ketiga yang dibina khusus di sekitar model OpenAI.

Mengubah tabiat adalah sukar, walaupun pesaing secara teknikal lebih baik dalam beberapa kawasan.

Ini mewujudkan dinamik halus. Google boleh memadankan atau melepasi ChatGPT pada peringkat model, tetapi itu sahaja tidak menjamin penghijrahan pengguna.

Penambahbaikan model penting, tetapi ia tidak berfungsi secara berasingan.

Penukaran bergantung pada faktor ekonomi dan aliran kerja yang lebih mendalam seperti kos yang lebih rendah untuk tugas konteks panjang, penyepaduan perusahaan yang lebih lancar atau ciri unik yang mengurangkan beban operasi syarikat.

Orang ramai akan bergerak jika keuntungan itu jelas kelihatan dalam kerja harian mereka, bukan kerana skor penanda aras telah meningkat.

Penyatuan, modal dan bayang-bayang gelembung

Skala kewangan di sekitar AI telah berkembang cukup besar untuk menarik soalan daripada pelabur. Sesetengah tawaran kelihatan bulat. Syarikat model mengumpul modal daripada pembekal awan, kemudian membelanjakan modal itu untuk perkhidmatan pengiraan pembekal awan.

Ini adalah salah satu sebab penganalisis memberi amaran bahawa bahagian sektor mungkin melambung lebih cepat daripada yang boleh diserap oleh belanjawan perusahaan.

Pada masa yang sama, beberapa syarikat masih mencatatkan nombor penggunaan yang kukuh.

Anthropic memberitahu pelabur bahawa ia mempunyai lebih daripada 300,000 pelanggan perniagaan dan perusahaan dan mengunjurkan untuk menggandakan atau bahkan tiga kali ganda pendapatan kepada sekitar $26 bilion tahun depan.

Google mengira 13 juta pembangun menggunakan Gemini sebagai sebahagian daripada aliran kerja mereka.

Walaupun angka-angka ini menunjukkan daya tarikan yang tulen, mereka juga menyerlahkan betapa mahalnya untuk berkembang pada tahap ini. Ketegangan antara penggunaan sebenar dan jangkaan yang terlalu besar ini mewujudkan persekitaran yang kelihatan serupa dengan kitaran internet awal.

Perbelanjaan modal adalah berat, penilaian tinggi dan sesetengah syarikat akan melebihkan.

Trend asas, bagaimanapun, tidak mungkin berbalik.

AI sudah menjadi sebahagian daripada perisian dan infrastruktur harian, tanpa mengira syarikat mana yang mendominasi barisan akhir.

Adakah NVIDIA terdedah dalam dunia silikon tersuai

Kedudukan NVIDIA di tengah-tengah beban kerja latihan telah mencetuskan kebimbangan tentang risiko jangka panjang apabila Google, Amazon dan lain-lain mempromosikan cip mereka sendiri.

Barisan TPU Google dan cip Trainium dan Inferentia Amazon adalah tanda trend yang lebih besar ke arah silikon tersuai yang direka untuk beban kerja tertentu.

Perkongsian Anthropic baru-baru ini merumitkan lagi gambaran.

Walaupun pelaburan besar Google dalam cipnya sendiri, Anthropic komited sehingga satu gigawatt kapasiti pengiraan menggunakan sistem Grace Blackwell dan Vera Rubin NVIDIA, disokong oleh pelaburan sehingga $10 bilion daripada NVIDIA dan $5 bilion daripada Microsoft.

Dalam jangka masa terdekat, NVIDIA tidak kehilangan tempat.

Permintaan untuk pengiraan berkembang dengan begitu pantas sehingga kedua-dua GPU dan pemecut tersuai diperlukan sekaligus.

Risiko untuk NVIDIA kelihatan lebih jauh.

Jika inferens menjadi beban kerja yang dominan dan hyperscaler mengalihkan sebahagian besar trafik itu kepada cip dalaman mereka sendiri, NVIDIA boleh menghadapi tekanan pada margin dan bukannya volum.

Latihan mungkin kekal menguntungkan, tetapi gabungan beban kerja akan beralih daripada segmen NVIDIA yang paling menguntungkan.

Ini tidak bermakna NVIDIA menghadapi masalah hari ini. Tiga hingga lima tahun akan datang kelihatan stabil kerana selera untuk latihan berjalan dan pengkomputeran am kekal besar.

Ancaman persaingan lebih kepada kuasa harga jangka panjang.

Hyperscalers mahu mengelakkan pergantungan kepada satu pembekal.

Mereka melabur dalam silikon mereka sendiri, bukan untuk menghapuskan NVIDIA tetapi untuk berunding dari kedudukan yang lebih kukuh.

Apa yang akan menentukan pemenang seterusnya

Perlumbaan AI memasuki fasa di mana kepimpinan bergantung kepada lebih daripada kejayaan model.

Pengedaran adalah sangat penting, terutamanya keupayaan untuk menyampaikan ciri AI kepada ratusan juta pengguna melalui platform yang telah digunakan oleh orang ramai setiap hari.

Penyepaduan juga penting, kerana syarikat mahukan alat yang masuk ke dalam aliran kerja sedia ada mereka tanpa gangguan.

Tiada jalan tunggal untuk menguasai.

Google boleh memanfaatkan Carian dan Android. Microsoft mempunyai Windows, Office dan GitHub.

Anthropic mengukir kedudukan di kalangan perusahaan yang mahukan model yang boleh dipercayai dan telus.

OpenAI terus memacu perkongsian minda pengguna melalui ChatGPT.

Bidang ini dibentuk oleh pakatan dan persaingan yang bertindih di mana rakan kongsi juga sering menjadi pesaing.

Fasa seterusnya ekonomi AI tidak akan memberi ganjaran kepada syarikat untuk saiz model mereka sahaja.

Ia akan memberi ganjaran kepada mereka yang boleh menghubungkan kecerdasan dengan tugas sebenar, keputusan sebenar dan nilai ekonomi sebenar.

Kuasa model menjadi banyak. Apa yang masih terhad ialah keupayaan untuk menukar kuasa itu kepada tingkah laku tahan lama, aliran kerja melekit dan permintaan jangka panjang.