La course à l’IA s’intensifie : quel modèle va dominer ?

  • Google, OpenAI et Anthropic accélèrent la course à l’IA avec de nouveaux modèles et des accords valant des milliards de dollars.
  • La croissance par inférence, les agents et la distribution comptent désormais plus que la taille du modèle.
  • NVIDIA fait face à une pression de marge à long terme alors que les hyperscalers étendent le silicium personnalisé.

Les avancées en IA arrivent plus vite que les utilisateurs ne peuvent les suivre.

La sortie de Gemini 3 de Google, les partenariats d’un milliard de dollars autour de Claude d’Anthropic, et les nouvelles mises à jour d’OpenAI ont condensé des années de progrès en une seule saison.

Toutes les grandes entreprises technologiques misent sur des modèles plus grands, de nouvelles puces et une expansion cloud agressive.

Mais la véritable question est de savoir si de meilleurs modèles suffisent à capter des milliards d’utilisateurs, à reconfigurer des industries entières et à soutenir les attentes économiques placées sur le boom de l’IA.

Un marché qui se développe plus vite que prévu

L’IA évolue désormais d’une technologie spécialisée pour s’étendre à la santé, au commerce de détail, à la finance, à la publicité et aux opérations d’entreprise.

Bloomberg Intelligence prévoit que l’IA générative à elle seule pourrait générer environ 1,8 billion de dollars de revenus annuels d’ici 2032, soit jusqu’à 16 % des dépenses technologiques mondiales.

Cela s’accompagne d’un changement d’infrastructure.

Les charges de travail en IA représentent déjà plus de 20 % du chiffre d’affaires mondial des serveurs, avec des prévisions apuntant à 40 % dans les années à venir.

Le secteur influence également la demande matérielle. L’entraînement de grands modèles a provoqué la première hausse des dépenses, mais l’inférence, l’utilisation quotidienne de l’IA dans des applications réelles, devient le moteur de plus en plus persistant.

Ce changement est important car les charges d’inférence n’arrivent pas par vagues.

Ils fonctionnent en continu dans les systèmes de service client, les outils de productivité, les moteurs publicitaires et les assistants de codage.

Les entreprises voient cela comme le début d’un long cycle d’infrastructures plutôt que comme une brève poussée liée à quelques laboratoires de recherche.

Gemini peut-il attraper ChatGPT ?

Google vient d’annoncer le lancement de Gemini 3, et cela montre à quel point la concurrence est devenue intense.

Gemini 3 a obtenu des scores records sur les principaux benchmarks de raisonnement et a introduit de nouvelles capacités de codage et d’agent.

Le modèle est intégré directement dans la recherche, l’application Gemini, Workspace et le mode IA de Google.

Google a rapporté 650 millions d’utilisateurs actifs mensuels pour Gemini et plus de 2 milliards pour les Aperçus IA dans la recherche.

Sur le papier, cela confère à l’entreprise une empreinte de distribution qui égale voire dépasse celle de ChatGPT.

Cependant, améliorer un modèle n’est pas la même chose que changer le comportement de l’utilisateur.

ChatGPT a récemment atteint 800 millions d’utilisateurs hebdomadaires et reste l’interface d’IA la plus familière pour beaucoup.

La force du produit ne réside pas simplement dans le modèle qui le sous-tend, mais aussi dans l’écosystème qui l’entoure.

Des millions de personnes utilisent ChatGPT dans GitHub Copilot, Windows, Microsoft 365, et des dizaines d’outils tiers conçus spécifiquement autour des modèles OpenAI.

Changer d’habitudes est difficile, même quand un concurrent est techniquement meilleur dans certains domaines.

Cela crée une dynamique subtile. Google peut égaler ou surpasser ChatGPT au niveau du modèle, mais cela ne garantit pas une migration des utilisateurs.

Les améliorations des modèles comptent, mais elles ne fonctionnent pas isolément.

Le changement dépend de facteurs économiques et de flux de travail plus profonds, tels que le coût réduit pour les tâches à long contexte, une intégration d’entreprise plus fluide ou des fonctionnalités uniques qui réduisent la charge opérationnelle d’une entreprise.

Les gens bougeront si le gain est clairement visible dans leur travail quotidien, et non parce qu’un score de référence a augmenté.

Consolidation, capital et l’ombre d’une bulle

L’ampleur financière autour de l’IA a suffisamment grandi pour susciter des questions de la part des investisseurs. Certaines transactions semblent circulaires. Une entreprise modèle lève des fonds auprès d’un fournisseur cloud, puis dépense ce capital pour les services informatiques de ce dernier.

C’est l’une des raisons pour lesquelles les analystes avertissent que certaines parties du secteur pourraient gonfler plus rapidement que les budgets des entreprises ne peuvent l’absorber.

Parallèlement, plusieurs entreprises affichent encore de solides chiffres d’adoption.

Anthropic a déclaré aux investisseurs qu’elle compte plus de 300 000 clients professionnels et entreprises et prévoit de doubler, voire tripler ses revenus, pour atteindre environ 26 milliards de dollars l’année prochaine.

Google compte 13 millions de développeurs utilisant Gemini dans leur flux de travail.

Bien que ces chiffres montrent une véritable relevance, ils soulignent aussi le coût de l’expansion à ce niveau. Cette tension entre une utilisation réelle et des attentes surdimensionnées crée un environnement qui ressemble au cycle précoce d’internet.

Les investissements sont lourds, les valorisations élevées, et certaines entreprises vont sur-étendre.

Cependant, la tendance sous-jacente est peu susceptible de s’inverser.

L’IA fait déjà partie intégrante des logiciels et infrastructures quotidiens, peu importe les entreprises qui dominent la gamme finale.

NVIDIA est-elle vulnérable dans un monde de silicium personnalisé

La position de NVIDIA au centre des charges de travail d’entraînement a suscité des inquiétudes quant aux risques à long terme, alors que Google, Amazon et d’autres font la promotion de leurs propres puces.

La gamme TPU de Google ainsi que les puces Trainium et Inferentia d’Amazon sont des signes d’une tendance plus large vers le silicium personnalisé conçu pour des charges de travail spécifiques.

Le récent partenariat avec Anthropic complique encore davantage la situation.

Malgré l’investissement important de Google dans ses propres puces, Anthropic s’est engagé jusqu’à un gigawatt de capacité de calcul en utilisant les systèmes Grace Blackwell et Vera Rubin de NVIDIA, soutenus par jusqu’à 10 milliards de dollars d’investissements de NVIDIA et 5 milliards de dollars de Microsoft.

À court terme, NVIDIA ne perd pas de terrain.

La demande en calcul augmente si rapidement que les GPU et les accélérateurs personnalisés sont nécessaires en même temps.

Le risque pour NVIDIA semble plus avancé.

Si l’inférence devient la charge de travail dominante et que les hyperscalers déplacent la majeure partie de ce trafic vers leurs propres puces internes, NVIDIA pourrait être mis sous pression sur les marges plutôt que sur les volumes.

La formation pourrait rester rentable, mais le mélange des charges de travail s’éloignerait du segment le plus lucratif de NVIDIA.

Cela ne signifie pas que NVIDIA est en difficulté aujourd’hui. Les trois à cinq prochaines années s’annoncent stables car l’appétit pour les entraînements et l’informatique générale reste énorme.

La menace concurrentielle concerne davantage le pouvoir de tarification à long terme.

Les hyperscalers veulent éviter la dépendance à un seul fournisseur.

Ils investissent dans leur propre silicium, non pas pour éliminer NVIDIA mais pour négocier depuis une position plus forte.

Qu’est-ce qui décidera des prochains gagnants

La course à l’IA entre dans une phase où le leadership dépend de plus que des percées de modèles.

La distribution est extrêmement importante, notamment la capacité à fournir des fonctionnalités d’IA à des centaines de millions d’utilisateurs via des plateformes déjà utilisées quotidiennement.

L’intégration compte aussi, car les entreprises veulent des outils qui s’intègrent dans leurs flux de travail existants sans perturbation.

Il n’y a pas de voie unique vers la domination.

Google peut exploiter la recherche et Android. Microsoft dispose de Windows, Office et GitHub.

Anthropic se forge une place parmi les entreprises qui souhaitent des modèles fiables et transparents.

OpenAI continue de stimuler la part d’esprit des consommateurs grâce à ChatGPT.

Le champ est façonné par des alliances et rivalités qui se chevauchent, où les partenaires sont souvent aussi des concurrents.

La prochaine phase de l’économie de l’IA ne récompensera pas les entreprises uniquement pour la taille de leurs modèles.

Elle récompensera ceux qui peuvent relier l’intelligence à de vraies tâches, de vraies décisions et une réelle valeur économique.

La puissance du modèle devient abondante. Ce qui reste rare, c’est la capacité à transformer cette puissance en comportements durables, en flux de travail collants et en demande à long terme.