Il CEO di Nvidia prevede una domanda di chip AI da $1T entro il 2027 al GTC

  • Nvidia prevede una domanda di chip AI da $1 trillion entro il 2027 mentre l'adozione dell'AI accelera.
  • Jensen Huang presenta la CPU Vera e il chip Groq 3 alla conferenza GTC.
  • I sistemi Vera Rubin promettono un aumento delle prestazioni per watt di 10x.

Nvidia prevede che gli ordini di acquisto per i suoi chip di intelligenza artificiale di nuova generazione raggiungeranno $1 trillion fino al 2027, sottolineando l'enorme domanda di calcolo generata dalla rapida espansione delle tecnologie AI.

Parlando alla conferenza annuale per sviluppatori GTC di Nvidia a San Jose, California, il CEO Jensen Huang ha detto che la domanda per i sistemi di chip Blackwell e Vera Rubin in arrivo dell'azienda sta accelerando mentre startup e grandi società tecnologiche aumentano la loro infrastruttura AI.

«Se potessero avere semplicemente più capacità, potrebbero generare più token, i loro ricavi aumenterebbero», ha detto Huang durante il suo intervento principale.

Le azioni Nvidia hanno chiuso in rialzo dell'1,63% lunedì dopo gli annunci.

La società aveva in precedenza stimato un'opportunità di ricavi di $500 billion derivante dalle due architetture di chip, ma ora i dirigenti Nvidia ritengono che la domanda supererà quelle proiezioni iniziali.

La direttrice finanziaria Colette Kress ha dichiarato il mese scorso che la società si aspetta che la crescita di quest'anno supererà la stima precedente.

Nvidia prevede una domanda massiccia di infrastrutture AI

I commenti di Huang evidenziano l'enorme domanda di capacità di calcolo trainata dall'intelligenza artificiale.

Le unità di elaborazione grafica (GPU) di Nvidia sono diventate la spina dorsale dei sistemi AI moderni, alimentando tutto, dai large language model ai software autonomi avanzati.

Man mano che l'industria AI evolve dalle applicazioni in stile chatbot a sistemi agentici capaci di svolgere compiti complessi tramite più agenti software, i requisiti computazionali si stanno espandendo rapidamente.

«È arrivato il punto di inflessione per l'inferenza», ha detto Huang alla conferenza.

Ha inoltre osservato che la domanda di capacità di calcolo è aumentata in modo drastico.

Secondo Huang, la domanda di calcolo per l'AI è aumentata di un milione di volte negli ultimi due anni.

Questa ondata sta guidando una costruzione senza precedenti di infrastrutture AI, compresi data center dotati dei chip ad alte prestazioni di Nvidia.

La società ha dichiarato all'inizio di quest'anno che il suo fatturato trimestrale potrebbe aumentare di circa il 77% su base annua, fino a circa $78 billion, estendendo una straordinaria serie di rapida crescita.

Nvidia ha ora registrato 11 trimestri consecutivi con una crescita dei ricavi superiore al 55%.

Nuovi chip e sistemi AI svelati al GTC

Oltre alle proiezioni di domanda, Nvidia ha presentato diverse nuove tecnologie progettate per supportare la fase successiva dello sviluppo dell'AI.

Uno dei punti salienti è stata Vera, una nuova CPU progettata specificamente per i carichi di lavoro di intelligenza artificiale agentica.

Nvidia ha affermato che il processore è il doppio più efficiente e il 50% più veloce rispetto alle CPU rack-scale tradizionali.

La società ha anche introdotto un rack di CPU Vera, che integra 256 CPU Vera raffreddate a liquido e può supportare oltre 22,500 ambienti CPU concorrenti.

Diversi grandi hyperscaler stanno già collaborando con Nvidia sul sistema.

«Vera arriva in un momento di svolta per l'AI. Man mano che l'intelligenza diventa agentica — capace di ragionare e agire — l'importanza dei sistemi che orchestrano quel lavoro aumenta», ha detto Huang.

«Con prestazioni rivoluzionarie ed efficienza energetica, Vera abilita sistemi AI che pensano più velocemente e scalano di più.»

La società ha anche presentato la Groq 3 Language Processing Unit (LPU), il primo chip prodotto a seguito dell'acquisto di asset da $20 billion della startup Groq lo scorso dicembre.

Il chip è progettato per migliorare l'elaborazione AI aumentando la capacità di memoria e accelerando i carichi di lavoro GPU.

Nvidia prevede di spedire la Groq 3 LPU nel terzo trimestre.

L'infrastruttura AI di nuova generazione prende forma

Nvidia si sta inoltre preparando a lanciare il suo sistema rack-scale Vera Rubin entro la fine dell'anno, che secondo la società offre dieci volte le prestazioni per watt rispetto al precedente sistema Grace Blackwell.

L'efficienza energetica è diventata una preoccupazione centrale con l'espansione globale dell'infrastruttura AI, dato che i data center richiedono quantità enormi di elettricità.

Per migliorare ulteriormente le prestazioni, Nvidia ha introdotto un rack Groq LPX capace di ospitare 256 LPU progettate per operare insieme al sistema Vera Rubin.

Huang ha detto che la nuova configurazione del rack può aumentare le prestazioni in termini di tokens-per-watt delle GPU Rubin di 35 volte.

«Abbiamo unito due processori con differenze estreme, uno per l'elevato throughput, uno per la bassa latenza. Questo non cambia il fatto che abbiamo bisogno di molta memoria», ha detto Huang.

«E quindi aggiungeremo un bel po' di chip Groq, che ampliano la quantità di memoria disponibile.»

Guardando avanti, Nvidia ha anche presentato in anteprima Kyber, un'architettura prototipo che costituirà la base dei suoi sistemi rack-scale di prossima generazione.

Il progetto integra 144 GPU disposte verticalmente in vassoi di calcolo per aumentare la densità e ridurre la latenza.

Kyber sarà incorporato in Vera Rubin Ultra, il prossimo grande sistema di infrastruttura AI di Nvidia previsto per la spedizione nel 2027.

Gli annunci rafforzano la posizione di Nvidia al centro della corsa globale all'infrastruttura AI mentre le aziende competono per distribuire sistemi di calcolo sempre più potenti a supporto di applicazioni di intelligenza artificiale avanzata.