Das KI-Rennen nimmt zu: Welches Modell wird dominieren?

  • Google, OpenAI und Anthropic beschleunigen das KI-Rennen mit neuen Modellen und Milliardendeals.
  • Inferenzwachstum, Agenten und Verteilung sind heute wichtiger als die Größe des Modells.
  • NVIDIA steht unter langfristigem Margendruck, da Hyperscaler maßgeschneidertes Silizium erweitern.

Fortschritte in der KI kommen schneller, als Nutzer sie verfolgen können.

Die Veröffentlichung von Googles Gemini 3, die milliardenschweren Partnerschaften rund um Anthropics Claude und frische Updates von OpenAI haben jahrelangen Fortschritt in eine einzige Staffel zusammengefasst.

Jedes große Tech-Unternehmen setzt auf größere Modelle, neue Chips und eine aggressive Cloud-Expansion.

Aber die eigentliche Frage ist, ob bessere Modelle ausreichen, um Milliarden von Nutzern zu gewinnen, ganze Branchen neu zu verdrahten und die wirtschaftlichen Erwartungen an den KI-Boom zu unterstützen.

Ein Markt, der schneller wächst als erwartet

KI breitet sich nun von einer Spezialtechnologie aus und breitet sich auf Gesundheitswesen, Einzelhandel, Finanzen, Werbung und Unternehmensbetriebe aus.

Bloomberg Intelligence prognostiziert , dass generative KI allein bis 2032 rund 1,8 Billionen Dollar Jahresumsatz generieren könnte, was bis zu 16 % der weltweiten Technologieausgaben entspricht.

Dies geht einher mit einer Verschiebung der Infrastruktur.

KI-Workloads machen bereits mehr als 20 % des weltweiten Serverumsatzes aus, mit Prognosen für 40 % in den kommenden Jahren.

Der Sektor beeinflusst auch die Nachfrage nach Hardware. Das Training großer Modelle führte zum ersten Anstieg der Ausgaben, aber Schlussfolgerung, also der alltägliche Einsatz von KI in realen Anwendungen, wird zunehmend zum beständigeren Treiber.

Diese Änderung ist wichtig, weil Inferenz-Workloads nicht in Wellen ankommen.

Sie laufen kontinuierlich in Kundenservicesystemen, Produktivitätstools, Werbemaschinen und Programmierassistenten.

Unternehmen sehen dies als Beginn eines langen Infrastrukturzyklus und nicht als einen kurzen Aufschwung, der an eine Handvoll Forschungslabore gebunden ist.

Kann Gemini ChatGPT fangen?

Google hat gerade die Einführung von Gemini 3 angekündigt, was zeigt, wie intensiv der Wettbewerb geworden ist.

Gemini 3 veröffentlichte Rekordwerte auf wichtigen Denkkriterien und führte neue Codierungs- und Agentenfunktionen ein.

Das Modell ist direkt in Search, die Gemini-App, Workspace und Googles KI-Modus integriert.

Google meldete 650 Millionen monatlich aktive Nutzer für Gemini und über 2 Milliarden für KI-Überblicke innerhalb der Suche.

Auf dem Papier verschafft das dem Unternehmen eine Vertriebsfläche, die mit ChatGPT mitkommt oder sogar übertrifft.

Allerdings ist die Verbesserung eines Modells nicht dasselbe wie die Änderung des Nutzerverhaltens.

ChatGPT hat kürzlich 800 Millionen wöchentliche Nutzer erreicht und bleibt für viele die bekannteste KI-Oberfläche.

Die Stärke des Produkts liegt nicht nur im dahinterstehenden Modell, sondern im umgebenden Ökosystem.

Millionen von Menschen nutzen ChatGPT in GitHub Copilot, Windows, Microsoft 365 und Dutzenden von Drittanbieter-Tools, die speziell auf OpenAI-Modelle zugeschnitten sind.

Gewohnheiten zu ändern ist schwierig, selbst wenn ein Konkurrent in manchen Bereichen technisch gesehen besser ist.

Das schafft eine subtile Dynamik. Google kann ChatGPT auf Modellebene erreichen oder übertreffen, aber das allein garantiert keine Nutzermigration.

Modellverbesserungen sind wichtig, aber sie funktionieren nicht isoliert.

Der Wechsel hängt von tieferen wirtschaftlichen und workflow-Faktoren ab, wie geringeren Kosten für Aufgaben mit langem Kontext, einer reibungsloseren Unternehmensintegration oder einzigartigen Merkmalen, die die operative Belastung eines Unternehmens verringern.

Die Menschen bewegen sich, wenn der Gewinn in ihrer täglichen Arbeit deutlich sichtbar ist, nicht weil ein Benchmark-Wert gestiegen ist.

Konsolidierung, Kapital und der Schatten einer Blase

Die finanzielle Skala rund um KI ist so groß geworden , dass sie Fragen von Investoren anzieht. Manche Angebote wirken zirkulär. Ein Modellunternehmen beschafft Kapital von einem Cloud-Anbieter und investiert dieses dann in die Rechendienste des Cloud-Anbieters.

Dies ist einer der Gründe, warum Analysten warnen, dass Teile des Sektors schneller wachsen könnten, als Unternehmensbudgets es aufnehmen können.

Gleichzeitig verzeichnen mehrere Unternehmen weiterhin starke Akzeptanzzahlen.

Anthropic teilte den Investoren mit, dass es mehr als 300.000 Geschäfts- und Unternehmenskunden hat und prognostiziert, den Umsatz im nächsten Jahr auf rund 26 Milliarden US-Dollar zu verdoppeln oder sogar zu verdreifachen.

Google zählt 13 Millionen Entwickler, die Gemini als Teil ihres Workflows nutzen.

Obwohl diese Zahlen echte Traktion zeigen, zeigen sie auch, wie teuer es ist, auf diesem Niveau zu expandieren. Diese Spannung zwischen realer Nutzung und übergroßen Erwartungen schafft ein Umfeld, das dem frühen Internetzyklus ähnelt.

Die Investitionskosten sind hoch, die Bewertungen sind hoch, und einige Unternehmen werden sich überbelasten.

Der zugrundeliegende Trend wird sich jedoch wahrscheinlich nicht umkehren.

KI wird bereits Teil der täglichen Software und Infrastruktur, unabhängig davon, welche Unternehmen die Endaufstellung dominieren.

Ist NVIDIA in einer Welt mit maßgeschneidertem Silizium verwundbar?

Die Position von NVIDIA im Zentrum der Trainingsarbeit hat Bedenken hinsichtlich langfristiger Risiken ausgelöst, da Google, Amazon und andere ihre eigenen Chips bewerben.

Googles TPU-Reihe sowie Amazons Trainium- und Inferentia-Chips sind Anzeichen für einen größeren Trend hin zu maßgeschneidertem Silizium, das für bestimmte Workloads entwickelt wurde.

Die jüngste Partnerschaft mit Anthropics verkompliziert das Bild noch mehr.

Trotz Googles massiver Investitionen in eigene Chips verpflichtete sich Anthropic bis zu einem Gigawatt Rechenkapazität mit den Systemen Grace Blackwell und Vera Rubin von NVIDIA, unterstützt durch Investitionen von bis zu 10 Milliarden Dollar von NVIDIA und 5 Milliarden Dollar von Microsoft.

Kurzfristig verliert NVIDIA keinen Boden mehr.

Die Nachfrage nach Rechenleistung wächst so schnell, dass sowohl GPUs als auch maßgeschneiderte Beschleuniger gleichzeitig benötigt werden.

Das Risiko für NVIDIA scheint weiter entfernt.

Wenn Inferenz zur dominierenden Arbeitslast wird und Hyperscaler den Großteil des Datenverkehrs auf ihre eigenen internen Chips verlagern, könnte NVIDIA eher bei den Margen als bei den Volumina unter Druck stehen.

Schulungen könnten zwar profitabel bleiben, aber die Arbeitsbelastung würde sich von NVIDIAs lukrativstem Segment entfernen.

Das bedeutet nicht, dass NVIDIA heute in Schwierigkeiten steckt. Die nächsten drei bis fünf Jahre sehen stabil aus, da der Appetit auf Trainingsläufe und allgemeine Rechenleistungen enorm bleibt.

Die Wettbewerbsbedrohung bezieht sich eher auf die langfristige Preissetzungsmacht.

Hyperscaler wollen vermeiden, auf einen einzigen Anbieter angewiesen zu sein.

Sie investieren in ihr eigenes Silizium, nicht um NVIDIA auszuschalten, sondern um aus einer stärkeren Position zu verhandeln.

Was wird die nächsten Gewinner bestimmen

Das KI-Rennen tritt in eine Phase ein, in der Führung von mehr als nur Modelldurchbrüchen abhängt.

Die Verteilung ist äußerst wichtig, insbesondere die Fähigkeit, KI-Funktionen über Plattformen, die Menschen bereits täglich nutzen, Hunderte Millionen von Nutzern bereitzustellen.

Integration ist ebenfalls wichtig, denn Unternehmen wollen Werkzeuge, die ohne Unterbrechung in ihre bestehenden Arbeitsabläufe einfließen können.

Es gibt keinen einzigen Weg zur Dominanz.

Google kann Search und Android nutzen. Microsoft hat Windows, Office und GitHub.

Anthropic schafft sich eine Position unter Unternehmen, die zuverlässige und transparente Modelle wollen.

OpenAI treibt weiterhin den Mindshare der Verbraucher durch ChatGPT voran.

Das Feld ist geprägt von sich überschneidenden Allianzen und Rivalitäten, bei denen Partner oft auch Konkurrenten sind.

Die nächste Phase der KI-Wirtschaft wird Unternehmen nicht allein für die Größe ihrer Modelle belohnen.

Es wird diejenigen belohnen, die Intelligenz mit echten Aufgaben, echten Entscheidungen und echtem wirtschaftlichen Wert verbinden können.

Modellantrieb wird immer reichlicher. Was knapp bleibt, ist die Fähigkeit, diese Kraft in dauerhaftes Verhalten, schwierige Arbeitsabläufe und langfristige Nachfrage umzuwandeln.