Cursa AI se intensifică: Ce model va domina?
- Google, OpenAI și Anthropic accelerează cursa AI cu modele noi și acorduri de miliarde de dolari.
- Creșterea inferenței, agenții și distribuția contează acum mai mult decât dimensiunea modelului.
- NVIDIA se confruntă cu presiuni pe termen lung asupra marjelor pe măsură ce hiperscalatoarele extind siliciul personalizat.
Progresele în AI vin mai repede decât utilizatorii le pot urmări.
Lansarea jocului Gemini 3 de la Google, parteneriatele de miliarde de dolari din jurul lui Claude de la Anthropic și actualizările noi de la OpenAI au condensat ani de progres într-un singur sezon.
Fiecare companie tehnologică majoră pariază pe modele mai mari, cipuri noi și o expansiune agresivă în cloud.
Dar adevărata problemă este dacă modele mai bune sunt suficiente pentru a capta miliarde de utilizatori, a reconfigura industrii întregi și a susține așteptările economice impuse de boom-ul AI.
O piață care se extinde mai rapid decât se aștepta
IA se extinde acum dintr-o tehnologie specializată și se extinde în domeniul sănătății, retailului, finanțelor, publicității și operațiunilor enterprise.
Bloomberg Intelligence estimează că IA generativă singură ar putea genera aproximativ 1,8 trilioane de dolari venituri anuale până în 2032, echivalentul a până la 16% din cheltuielile globale de tehnologie.
Acest lucru este însoțit de o schimbare a infrastructurii.
Sarcinile de lucru ale IA reprezintă deja peste 20% din veniturile globale ale serverelor, cu prognoze care indică 40% în anii următori.
Sectorul influențează, de asemenea, cererea de hardware. Antrenarea modelelor mari a creat prima creștere a cheltuielilor, dar inferența, utilizarea zilnică a inteligenței artificiale în aplicații reale, devine motorul mai persistent.
Această schimbare contează deoarece sarcinile de inferență nu ajung în valuri.
Acestea funcționează continuu în sisteme de servicii pentru clienți, instrumente de productivitate, motoare publicitare și asistenți de programare.
Companiile văd acest lucru ca pe începutul unui ciclu lung de infrastructură, nu ca pe o scurtă creștere legată de câteva laboratoare de cercetare.
Poate Gemini să prindă ChatGPT?
Google tocmai a anunțat lansarea Gemini 3 și arată cât de intensă a devenit concurența.
Gemini 3 a înregistrat scoruri record la principalele benchmark-uri de raționament și a introdus noi capabilități de codare și agenție.
Modelul este integrat direct în Search, aplicația Gemini, Workspace și modul AI al Google.
Google a raportat 650 de milioane de utilizatori activi lunar pentru Gemini și peste 2 miliarde pentru AI Overviews în cadrul căutării.
Pe hârtie, acest lucru oferă companiei o amprentă de distribuție care egalează sau chiar depășește ChatGPT.
Totuși, îmbunătățirea unui model nu este același lucru cu schimbarea comportamentului utilizatorului.
ChatGPT a ajuns recent la 800 de milioane de utilizatori săptămânali și rămâne cea mai cunoscută interfață AI pentru mulți.
Forța produsului nu constă doar în modelul din spatele său, ci în ecosistemul din jurul său.
Milioane de oameni folosesc ChatGPT în GitHub Copilot, Windows, Microsoft 365 și zeci de instrumente terțe construite special în jurul modelelor OpenAI.
Schimbarea obiceiurilor este dificilă, chiar și atunci când un competitor este tehnic mai bun în anumite domenii.
Aceasta creează o dinamică subtilă. Google poate egala sau depăși ChatGPT la nivel de model, dar acest lucru singur nu garantează o migrație a utilizatorilor.
Îmbunătățirile modelului contează, dar nu funcționează izolat.
Schimbarea depinde de factori economici și de fluxuri de lucru mai profundi, cum ar fi costuri mai mici pentru sarcini pe termen lung, integrare mai fluidă a întreprinderii sau caracteristici unice care reduc povara operațională a companiei.
Oamenii se vor muta dacă câștigul este clar vizibil în munca lor zilnică, nu pentru că un scor de referință a crescut.
Consolidare, capital și umbra unei bule
Scara financiară în jurul AI a crescut suficient de mare încât să atragă întrebări din partea investitorilor. Unele tranzacții par circulare. O companie model strânge capital de la un furnizor de cloud, apoi investește acel capital pe serviciile de calcul ale furnizorului de cloud.
Acesta este unul dintre motivele pentru care analiștii avertizează că anumite părți ale sectorului ar putea crește mai repede decât pot absorbi bugetele întreprinderilor.
În același timp, mai multe companii continuă să înregistreze cifre puternice de adopții.
Anthropic le-a spus investitorilor că are peste 300.000 de clienți de afaceri și companii și preconizează să dubleze sau chiar tripleze veniturile, ajungând la aproximativ 26 de miliarde de dolari anul viitor.
Google numără 13 milioane de dezvoltatori care folosesc Gemini ca parte a fluxului lor de lucru.
Deși aceste cifre arată o tracțiune reală, ele evidențiază și cât de costisitor este extinderea la acest nivel. Această tensiune între utilizarea reală și așteptările supradimensionate creează un mediu care seamănă cu ciclul timpuriu al internetului.
Capex-ul este greu, evaluările sunt ridicate, iar unele companii vor suprasolicita.
Totuși, tendința de bază este puțin probabil să se inverseze.
AI devine deja parte din software-ul și infrastructura de zi cu zi, indiferent de companiile care domină gama finală.
Este NVIDIA vulnerabilă într-o lume a siliciului personalizat
Poziția NVIDIA în centrul sarcinilor de antrenament a stârnit îngrijorări legate de riscul pe termen lung, pe măsură ce Google, Amazon și alții își promovează propriile cipuri.
Linia TPU a Google și cipurile Trainium și Inferentia de la Amazon sunt semne ale unei tendințe mai mari către siliciu personalizat conceput pentru sarcini de lucru specifice.
Parteneriatul recent cu Anthropic complică și mai mult situația.
În ciuda investițiilor mari ale Google în propriile cipuri, Anthropic a angajat până la un gigawatt de capacitate de calcul folosind sistemele NVIDIA Grace Blackwell și Vera Rubin, susținute de până la 10 miliarde de dolari investiții de la NVIDIA și 5 miliarde de dolari de la Microsoft.
Pe termen scurt, NVIDIA nu pierde teren.
Cererea pentru calcul crește atât de rapid încât atât GPU-urile, cât și acceleratoarele personalizate sunt necesare simultan.
Riscul pentru NVIDIA pare mai îndepărtat.
Dacă inferența devine sarcina de lucru dominantă și hyperscalerii redirecționează cea mai mare parte a traficului către propriile lor cipuri interne, NVIDIA ar putea avea presiune asupra marjelor, nu a volumelor.
Instruirea ar putea rămâne profitabilă, dar mixul de sarcini s-ar îndepărta de cel mai profitabil segment al NVIDIA.
Asta nu înseamnă că NVIDIA are probleme astăzi. Următorii trei până la cinci ani par stabili, deoarece apetitul pentru antrenamente, curse și calcul general rămâne enorm.
Amenințarea competitivă ține mai mult de puterea de stabilire a prețurilor pe termen lung.
Hyperscalerii doresc să evite dependența de un singur furnizor.
Ei investesc în propriul lor siliciu, nu pentru a elimina NVIDIA, ci pentru a negocia dintr-o poziție mai puternică.
Ce va decide următorii câștigători
Cursa AI intră într-o fază în care leadershipul depinde de mai mult decât de descoperirile modelelor.
Distribuția este extrem de importantă, în special capacitatea de a livra funcționalități AI pentru sute de milioane de utilizatori prin platforme pe care oamenii le folosesc deja zilnic.
Integrarea contează de asemenea, pentru că companiile își doresc instrumente care să se integreze în fluxurile lor de lucru existente fără întreruperi.
Nu există o singură cale spre dominație.
Google poate valorifica Search și Android. Microsoft are Windows, Office și GitHub.
Anthropic își croiește un loc printre companiile care doresc modele fiabile și transparente.
OpenAI continuă să crească atenția consumatorilor prin ChatGPT.
Câmpul este modelat de alianțe și rivalități suprapuse, unde partenerii sunt adesea și concurenți.
Următoarea fază a economiei AI nu va recompensa companiile doar pentru dimensiunea modelelor lor.
Va recompensa pe cei care pot conecta inteligența cu sarcini reale, decizii reale și valoare economică reală.
Puterea modelelor devine din ce în ce mai abundentă. Ceea ce rămâne rar este capacitatea de a transforma această putere în comportamente durabile, fluxuri de lucru complicate și cerere pe termen lung.
Meta construiește o nouă afacere de $20B, spune Truist
Dow urcă; Nasdaq scade pe vânzări de cipuri și temeri legate de IPO-ul SpaceX
Acțiunile DraftKings sar 11% pe fondul unui salt al volumelor pe piețele de predicții
Datele opțiunilor arată cum ar putea reacționa acțiunile Oracle la raportul T4 de mâine
Acțiunile Broadcom scad în ciuda noului parteneriat pentru centre de date AI
Nu s-au găsit rezultate
Se încarcă articolele...
Failed to load articles. Please try again.