CEO Nvidia: popyt na chipy AI osiągnie $1T do 2027 na GTC

Nvidia spodziewa się, że zamówienia na jej następnej generacji układy sztucznej inteligencji osiągną $1T do 2027 r., co podkreśla ogromne zapotrzebowanie na moc obliczeniową wywołane szybkim rozwojem technologii AI.

Występując na corocznej konferencji deweloperów GTC Nvidii w San Jose w Kalifornii, CEO Jensen Huang powiedział, że popyt na nadchodzące systemy układów Blackwell i Vera Rubin przyspiesza, ponieważ startupy i duże firmy technologiczne skalują swoją infrastrukturę AI.

„Gdyby mogły tylko uzyskać więcej mocy, mogłyby generować więcej tokenów, ich przychody wzrosłyby” — powiedział Huang podczas swojego wystąpienia.

Akcje Nvidii zamknęły poniedziałkową sesję 1,63% powyżej po ogłoszeniach.

Spółka wcześniej szacowała okazję przychodową z obu architektur układów na $500 billion, jednak kierownictwo Nvidii uważa teraz, że popyt przewyższy te wcześniejsze prognozy.

Dyrektor finansowa Colette Kress powiedziała w ubiegłym miesiącu, że spółka spodziewa się, iż wzrost w tym roku przewyższy wcześniejsze szacunki.

Nvidia prognozuje ogromny popyt na infrastrukturę AI

Uwagi Huanga uwydatniają ogromne zapotrzebowanie na moc obliczeniową napędzane przez sztuczną inteligencję.

Procesory graficzne (GPU) Nvidii stały się kręgosłupem nowoczesnych systemów AI, wspierając wszystko, od dużych modeli językowych po zaawansowane oprogramowanie autonomiczne.

W miarę jak branża AI przekształca się z aplikacji w stylu chatbotów w systemy agentowe zdolne do wykonywania złożonych zadań przez wiele oprogramowanych agentów, wymagania obliczeniowe szybko rosną.

„Nadszedł punkt zwrotny dla wnioskowania” — powiedział Huang na konferencji.

Zauważył również, że zapotrzebowanie na moc obliczeniową gwałtownie wzrosło.

Według Huanga popyt na obliczenia AI zwiększył się milion razy w ciągu ostatnich dwóch lat.

Ten wzrost napędza bezprecedensową rozbudowę infrastruktury AI, w tym centra danych wyposażone w wysokowydajne układy Nvidii.

Spółka wcześniej podała, że jej przychody kwartalne mają wzrosnąć około 77% rok do roku do około $78 billion, przedłużając wyjątkowy okres szybkiego wzrostu.

Nvidia odnotowała już 11 kolejnych kwartałów ze wzrostem przychodów powyżej 55%.

Nowe układy i systemy AI zaprezentowane na GTC

Obok prognoz popytu Nvidia zaprezentowała kilka nowych technologii zaprojektowanych, by wspierać kolejny etap rozwoju AI.

Jednym z największych punktów programu była Vera, nowy CPU zaprojektowany specjalnie pod obciążenia związane z agentową sztuczną inteligencją.

Nvidia podała, że procesor jest dwukrotnie bardziej efektywny i o 50% szybszy niż tradycyjne procesory w skali szafy serwerowej.

Spółka wprowadziła również Vera CPU rack, który integruje 256 chłodzonych cieczą procesorów Vera i może obsługiwać ponad 22 500 jednoczesnych środowisk CPU.

Wiele dużych hyperscalerów już współpracuje z Nvidią nad tym systemem.

„Vera pojawia się w punkcie zwrotnym dla AI. W miarę jak inteligencja staje się agentowa — zdolna do rozumowania i działania — znaczenie systemów orkiestrujących tę pracę rośnie” — powiedział Huang.

„Dzięki przełomowej wydajności i efektywności energetycznej Vera umożliwia systemom AI szybsze myślenie i dalszą skalowalność.”

Spółka zaprezentowała także Groq 3 Language Processing Unit (LPU), pierwszy układ wyprodukowany po przejęciu startupu Groq za $20 billion w grudniu.

Układ ma na celu usprawnienie przetwarzania AI poprzez zwiększenie pojemności pamięci i przyspieszenie obciążeń GPU.

Nvidia planuje wysyłkę Groq 3 LPU w trzecim kwartale.

Kształtuje się infrastruktura AI następnej generacji

Nvidia przygotowuje się również do wprowadzenia systemu rack-scale Vera Rubin jeszcze w tym roku, który — jak twierdzi spółka — zapewnia dziesięciokrotnie większą wydajność na wat w porównaniu z poprzednim systemem Grace Blackwell.

Efektywność energetyczna stała się kluczowym zagadnieniem w miarę globalnej ekspansji infrastruktury AI, ponieważ centra danych wymagają ogromnych ilości energii elektrycznej.

Aby dodatkowo poprawić wydajność, Nvidia wprowadziła Groq LPX rack zdolny pomieścić 256 LPU, zaprojektowany do współpracy z systemem Vera Rubin.

Huang powiedział, że nowa konfiguracja racka może zwiększyć wydajność tokenów na wat GPU Rubin o 35 razy.

„Połączyliśmy, zunifikowaliśmy dwa procesory o skrajnie różnych charakterystykach, jeden dla dużej przepustowości, drugi dla niskiej latencji. To jednak nie zmienia faktu, że potrzebujemy dużo pamięci” — powiedział Huang.

„I dlatego po prostu dodamy całą masę układów Groq, co zwiększy ilość dostępnej pamięci.”

Patrząc w przyszłość, Nvidia zaprezentowała także Kyber, prototypową architekturę, która będzie fundamentem jej systemów rack-scale następnej generacji.

Projekt integruje 144 GPU rozmieszczone pionowo w tacach obliczeniowych, aby zwiększyć zagęszczenie i zmniejszyć opóźnienia.

Kyber zostanie włączony do Vera Rubin Ultra, następnego dużego systemu infrastruktury AI Nvidii, którego wysyłki spodziewane są w 2027 r.

Ogłoszenia te wzmacniają pozycję Nvidii w centrum globalnego wyścigu o infrastrukturę AI, gdy firmy rywalizują o wdrożenie coraz potężniejszych systemów obliczeniowych wspierających zaawansowane zastosowania sztucznej inteligencji.

CEO Nvidia: popyt na chipy AI osiągnie $1T do 2027 na GTC

Nvidia prognozuje ogromny popyt na infrastrukturę AI

Nowe układy i systemy AI zaprezentowane na GTC

Kształtuje się infrastruktura AI następnej generacji

Moonshot AI wstrzymuje subskrypcje Kimi K3 z powodu przeciążenia mocy obliczeniowej

Apple odzyskuje status najcenniejszej firmy na świecie, wyprzedzając Nvidię

Dlaczego akcje IREN, CoreWeave i Nebius gwałtownie tracą na wartości

Akcje Amazon tracą impet — czy nadchodzące wyniki rozpalą odbicie?

Kimi K3: największy jak dotąd otwarty projekt AI Moonshot