La corsa all'IA si intensifica: quale modello dominerà?

I progressi nell'IA arrivano più velocemente di quanto gli utenti possano tracciarli.

Il rilascio di Gemini 3 di Google, le partnership da miliardi di dollari attorno a Claude di Anthropic e i nuovi aggiornamenti di OpenAI hanno condensato anni di progressi in una sola stagione.

Ogni grande azienda tecnologica punta su modelli più grandi, nuovi chip e un'espansione cloud aggressiva.

Ma la vera questione è se modelli migliori siano sufficienti a catturare miliardi di utenti, rifare intere industrie e sostenere le aspettative economiche poste sul boom dell'IA.

Un mercato in espansione più veloce delle aspettative

L'IA si sta ora espandendo da una tecnologia specializzata e si sta diffondendo in sanità, retail, finanza, pubblicità e operazioni aziendali.

Bloomberg Intelligence prevede che l'IA generativa da sola potrebbe generare circa 1,8 trilioni di dollari di ricavi annui entro il 2032, pari a un massimo del 16% della spesa tecnologica globale.

Questo è accompagnato da un cambiamento nelle infrastrutture.

I carichi di lavoro dell'IA rappresentano già più del 20% dei ricavi globali dei server, con previsioni che indicano il 40% nei prossimi anni.

Il settore sta influenzando anche la domanda di hardware. Addestrare grandi modelli ha creato il primo picco di spesa, ma l'inferenza, l'uso quotidiano dell'IA nelle applicazioni reali, sta diventando il motore più persistente.

Questo cambiamento è importante perché i carichi di lavoro di inferenza non arrivano a ondate.

Funzionano continuamente in sistemi di servizio clienti, strumenti di produttività, motori pubblicitari e assistenti di programmazione.

Le aziende vedono questo come l'inizio di un lungo ciclo infrastrutturale piuttosto che come un breve aumento legato a pochi laboratori di ricerca.

Gemini può raggiungere ChatGPT?

Google ha appena annunciato il lancio di Gemini 3, e questo dimostra quanto sia diventata intensa la competizione.

Gemini 3 ha ottenuto punteggi record nei principali benchmark di ragionamento e ha introdotto nuove capacità di codifica e agenti.

Il modello è integrato direttamente in Ricerca, nell'app Gemini, in Workspace e nella modalità AI di Google.

Google ha riportato 650 milioni di utenti attivi mensili per Gemini e oltre 2 miliardi per le Panoramiche AI all'interno di Ricerca.

Sulla carta, questo dà all'azienda un'impronta di distribuzione che eguaglia o addirittura supera ChatGPT.

Tuttavia, migliorare un modello non è la stessa cosa che cambiare il comportamento dell'utente.

ChatGPT ha recentemente raggiunto 800 milioni di utenti settimanali e rimane l'interfaccia AI più familiare per molti.

La forza del prodotto non è semplicemente il modello che lo sostiene, ma l'ecosistema che lo circonda.

Milioni di persone usano ChatGPT all'interno di GitHub Copilot, Windows, Microsoft 365 e dozzine di strumenti di terze parti creati specificamente attorno ai modelli OpenAI.

Cambiare abitudini è difficile, anche quando un concorrente è tecnicamente migliore in alcune aree.

Questo crea una dinamica sottile. Google può eguagliare o superare ChatGPT a livello di modello, ma questo da solo non garantisce una migrazione degli utenti.

I miglioramenti dei modelli contano, ma non funzionano in isolamento.

Il passaggio dipende da fattori economici e di workflow più profondi, come costi inferiori per compiti a lungo contesto, integrazione aziendale più fluida o caratteristiche uniche che riducono il carico operativo di un'azienda.

Le persone si muoveranno se il guadagno è chiaramente visibile nel loro lavoro quotidiano, non perché un punteggio di riferimento sia aumentato.

Consolidamento, capitale e l'ombra di una bolla

La scala finanziaria attorno all'IA è cresciuta abbastanza da suscitare domande da parte degli investitori. Alcuni accordi sembrano circolari. Un'azienda modello raccoglie capitali da un fornitore cloud, poi spende quei capitali per i servizi di calcolo del fornitore cloud.

Questa è una delle ragioni per cui gli analisti avvertono che alcune parti del settore potrebbero gonfiarsi più rapidamente di quanto i budget aziendali possano assorbire.

Allo stesso tempo, diverse aziende continuano a registrare numeri di adozione elevati.

Anthropic ha detto agli investitori di avere più di 300.000 clienti aziendali e aziendali e prevede di raddoppiare o addirittura triplicare i ricavi fino a circa 26 miliardi di dollari il prossimo anno.

Google conta 13 milioni di sviluppatori che utilizzano Gemini come parte del loro flusso di lavoro.

Sebbene questi dati mostrino una vera trazione, evidenziano anche quanto costi espandere a questo livello. Questa tensione tra uso reale e aspettative sovradimensionate crea un ambiente che ricorda il primo ciclo di internet.

Il capex è pesante, le valutazioni sono alte e alcune aziende si esporranno troppo.

La tendenza sottostante, tuttavia, difficilmente si invertirà.

L'IA sta già diventando parte integrante del software e delle infrastrutture quotidiane, indipendentemente da quali aziende dominino la gamma finale.

NVIDIA è vulnerabile in un mondo di silicio personalizzato

La posizione di NVIDIA al centro dei carichi di lavoro di addestramento ha suscitato preoccupazioni sul rischio a lungo termine, mentre Google, Amazon e altri promuovono i propri chip.

La linea TPU di Google e i chip Trainium e Inferentia di Amazon sono segni di una tendenza più ampia verso silici personalizzati progettati per carichi di lavoro specifici.

La recente collaborazione con Anthropic complica ulteriormente il quadro.

Nonostante il forte investimento di Google nei propri chip, Anthropic ha preso fino a un gigawatt di capacità di calcolo utilizzando i sistemi NVIDIA Grace Blackwell e Vera Rubin, supportati da investimenti fino a 10 miliardi di dollari da parte di NVIDIA e 5 miliardi di dollari da Microsoft.

Nel breve termine, NVIDIA non sta perdendo terreno.

La domanda di calcolo sta crescendo così rapidamente che sono necessari contemporaneamente sia GPU che acceleratori personalizzati.

Il rischio per NVIDIA appare più lontano.

Se l'inferenza dovesse diventare il carico di lavoro dominante e gli hyperscaler spostassero la maggior parte di quel traffico sui propri chip interni, NVIDIA potrebbe affrontare pressioni sui margini piuttosto che sui volumi.

La formazione potrebbe rimanere redditizia, ma la combinazione di carichi di lavoro si allontanerebbe dal segmento più redditizio di NVIDIA.

Questo non significa che NVIDIA sia nei guai oggi. I prossimi tre-cinque anni appaiono stabili perché l'appetito per le corse di addestramento e il calcolo generale rimane enorme.

La minaccia competitiva riguarda più il potere di stabilire i prezzi a lungo termine.

Gli hyperscaler vogliono evitare la dipendenza da un singolo fornitore.

Stanno investendo nel proprio silicio, non per eliminare NVIDIA ma per negoziare da una posizione più forte.

Cosa deciderà i prossimi vincitori

La corsa all'IA sta entrando in una fase in cui la leadership dipende da più delle semplici innovazioni dei modelli.

La distribuzione è estremamente importante, soprattutto la capacità di fornire funzionalità di IA a centinaia di milioni di utenti attraverso piattaforme che le persone già utilizzano quotidianamente.

Anche l'integrazione conta, perché le aziende vogliono strumenti che si integrino nei loro flussi di lavoro esistenti senza interruzioni.

Non esiste un unico percorso per il dominio.

Google può sfruttare Search e Android. Microsoft ha Windows, Office e GitHub.

Anthropic si sta facendo strada tra le imprese che vogliono modelli affidabili e trasparenti.

OpenAI continua a generare la condivisione mentale dei consumatori tramite ChatGPT.

Il campo è formato da alleanze e rivalità sovrapposte, dove spesso anche i partner sono concorrenti.

La prossima fase dell'economia dell'IA non premierà le aziende solo per la dimensione dei loro modelli.

Premierà coloro che riescono a collegare l'intelligenza a compiti reali, decisioni reali e reale valore economico.

Il potere dei modelli sta diventando abbondante. Ciò che rimane scarso è la capacità di trasformare questa potenza in comportamenti durevoli, flussi di lavoro rigidi e domanda a lungo termine.

La corsa all'IA si intensifica: quale modello dominerà?

Un mercato in espansione più veloce delle aspettative

Gemini può raggiungere ChatGPT?

Consolidamento, capitale e l'ombra di una bolla

NVIDIA è vulnerabile in un mondo di silicio personalizzato

Cosa deciderà i prossimi vincitori

Dow +380 punti, rally dei chip spinge Wall Street prima delle trimestrali Big Tech

Palo Alto scende del 3%: perché l'analista lo considera ancora una scelta top per la cybersecurity

Azioni Micron +12%: cosa sta guidando oggi il titolo della memoria

Dove indicano le opzioni il titolo Tesla dopo i risultati del Q2

Cosa aspettarsi dai risultati Q2 di Alphabet: IA, Gemini e cloud al centro