Le PDG de Nvidia voit $1T de demande de puces IA d'ici 2027 au GTC
- Nvidia prévoit une demande de puces IA de $1 trillion d'ici 2027 alors que l'adoption de l'IA s'accélère.
- Jensen Huang dévoile le CPU Vera et la puce Groq 3 à la conférence GTC.
- Les systèmes Vera Rubin promettent un gain de performance par watt de 10x.
Nvidia prévoit que les commandes pour ses puces d'intelligence artificielle de prochaine génération atteindront $1 trillion d'ici 2027, soulignant la demande massive en capacité de calcul créée par l'expansion rapide des technologies d'IA.
Lors de la conférence annuelle GTC pour développeurs de Nvidia à San Jose (Californie), le PDG Jensen Huang a déclaré que la demande pour les prochains systèmes de puces Blackwell et Vera Rubin de la société s'accélère alors que les startups et les grandes entreprises technologiques renforcent leur infrastructure IA.
« Si elles pouvaient simplement obtenir plus de capacité, elles pourraient générer plus de tokens, leurs revenus augmenteraient », a déclaré Huang lors de son intervention principale.
Les actions Nvidia ont clôturé en hausse de 1,63 % lundi après les annonces.
La société avait précédemment estimé une opportunité de revenus de $500 billion liée aux deux architectures de puces, mais les dirigeants de Nvidia estiment désormais que la demande dépassera ces projections antérieures.
La directrice financière Colette Kress a déclaré le mois dernier que la société s'attend à ce que la croissance cette année dépasse l'estimation antérieure.
Nvidia anticipe une demande massive d'infrastructures IA
Les commentaires de Huang soulignent l'énorme demande de puissance de calcul entraînée par l'intelligence artificielle.
Les unités de traitement graphique (GPU) de Nvidia sont devenues l'épine dorsale des systèmes d'IA modernes, alimentant tout, des grands modèles de langage aux logiciels autonomes avancés.
À mesure que l'industrie de l'IA évolue des applications de type chatbot vers des systèmes agentifs capables d'exécuter des tâches complexes via plusieurs agents logiciels, les exigences de calcul s'étendent rapidement.
« Le tournant de l'inférence est arrivé », a déclaré Huang lors de la conférence.
Il a également noté que la demande de puissance de calcul a fortement augmenté.
Selon Huang, la demande de calcul pour l'IA a augmenté d'un million de fois au cours des deux dernières années.
Cette poussée entraîne un déploiement sans précédent d'infrastructures IA, y compris des centres de données équipés des puces haute performance de Nvidia.
La société a déclaré plus tôt cette année que son chiffre d'affaires trimestriel devrait bondir d'environ 77 % en glissement annuel pour atteindre environ $78 billion, prolongeant une série remarquable de croissance rapide.
Nvidia a désormais enregistré 11 trimestres consécutifs avec une croissance du chiffre d'affaires supérieure à 55 %.
Nouvelles puces et systèmes IA dévoilés au GTC
En parallèle des projections de demande, Nvidia a dévoilé plusieurs nouvelles technologies conçues pour soutenir la prochaine phase de développement de l'IA.
L'un des points forts était Vera, un nouveau CPU conçu spécifiquement pour des charges de travail d'IA reposant sur des agents.
Nvidia affirme que le processeur est deux fois plus efficace et 50 % plus rapide que les CPU traditionnels à l'échelle des racks.
La société a également présenté un rack Vera CPU, qui intègre 256 CPU Vera refroidis par liquide et peut prendre en charge plus de 22 500 environnements CPU simultanés.
Plusieurs hyperscalers majeurs collaborent déjà avec Nvidia sur le système.
« Vera arrive à un tournant pour l'IA. À mesure que l'intelligence devient agentive — capable de raisonner et d'agir — l'importance des systèmes orchestrant ce travail est amplifiée », a déclaré Huang.
« Avec des performances et une efficacité énergétique révolutionnaires, Vera débloque des systèmes d'IA qui pensent plus vite et se déploient à plus grande échelle. »
La société a aussi dévoilé la Groq 3 Language Processing Unit (LPU), la première puce produite suite à l'achat d'actifs de la startup Groq par Nvidia pour $20 billion en décembre.
La puce est conçue pour améliorer le traitement de l'IA en augmentant la capacité mémoire et en accélérant les charges de travail GPU.
Nvidia prévoit d'expédier la Groq 3 LPU au troisième trimestre.
L'infrastructure IA de nouvelle génération prend forme
Nvidia se prépare également à lancer cette année son système à l'échelle des racks Vera Rubin, que la société dit offrir dix fois plus de performance par watt par rapport au système Grace Blackwell précédent.
L'efficacité énergétique est devenue une préoccupation majeure à mesure que l'infrastructure IA se développe à l'échelle mondiale, les centres de données nécessitant des quantités énormes d'électricité.
Pour améliorer encore les performances, Nvidia a présenté un rack Groq LPX capable d'accueillir 256 LPU conçues pour fonctionner aux côtés du système Vera Rubin.
Huang a déclaré que la nouvelle configuration de rack peut augmenter la performance en tokens par watt des GPU Rubin de 35 fois.
« Nous avons uni, unifié deux processeurs aux différences extrêmes, l'un pour le haut débit, l'autre pour la faible latence. Cela ne change pas le fait que nous avons besoin de beaucoup de mémoire, » a déclaré Huang.
« Et donc nous allons simplement ajouter tout un tas de puces Groq, ce qui augmente la quantité de mémoire dont il dispose. »
En regardant vers l'avenir, Nvidia a également présenté Kyber, une architecture prototype qui constituera la base de ses prochains systèmes informatiques à l'échelle des racks.
La conception intègre 144 GPU disposés verticalement dans des plateaux de calcul pour augmenter la densité et réduire la latence.
Kyber sera intégré à Vera Rubin Ultra, le prochain grand système d'infrastructure IA de Nvidia prévu pour être livré en 2027.
Les annonces renforcent la position de Nvidia au centre de la course mondiale à l'infrastructure IA alors que les entreprises se disputent le déploiement de systèmes de calcul de plus en plus puissants pour soutenir des applications d'intelligence artificielle avancées.
Auto-amélioration récursive : pourquoi Anthropic veut ralentir le développement de l'IA
Nvidia chute encore de 3% : pourquoi Computex n'a pas déclenché de rebond
OpenAI s'engage à se conformer à l'ordre de Trump sur l'examen des IA
La Chine accélère l'IA avec 1.1B yuan pour une plateforme idéologique
Jensen Huang (Nvidia) évoque l'opportunité IA de mille milliards de dollars en Corée
Aucun résultat trouvé
Chargement des articles...
Failed to load articles. Please try again.