Kinas DeepSeek træner Nvidia-drevet R1 AI for kun $294K: her er, hvad det betyder

  • DeepSeek's R1 trænede for $294K på 512 Nvidia H800 GPU'er, hvilket trodsede dyre vestlige AI-normer.
  • Open source-design med lama-inspirerede metoder sætter gang i debatten om etik og performance.
  • Kina bakker op om Huawei og Cambricon-chips, da AI-sektoren tilpasser sig amerikanske eksportrestriktioner.

Kinas DeepSeek har lige rystet AI-verdenen ved at afsløre, at den trænede sin nye R1-model til forbløffende 294.000 dollars, en brøkdel af de iøjnefaldende omkostninger, der ses i Vesten.

Dette træk handler ikke kun om dollars; det sætter DeepSeek i hjertet af en generativ AI-revolution, hvor overkommelige priser møder banebrydende ydeevne, og den globale hakkeorden pludselig er i bevægelse.

DeepSeeks omkostningsknusende AI-projekt: Hvad betyder det?

Historien bag DeepSeek's seneste spring er bemærkelsesværdig.

DeepSeek, der blev offentliggjort i en peer-reviewed Nature-artikel i denne uge, afslørede, at træning af sin "ræsonnementscentrerede" R1-model kun kostede 294.000 dollars, en fantastisk kontrast til OpenAI og Google, hvis indsats kan løbe op i hundredvis af millioner.

Det Hangzhou-baserede team var afhængige af 512 af Nvidias H800 GPU'er, en Kina-kompatibel chip designet til eksport under amerikanske tekniske restriktioner, og brugte teknikker som destillation, hvor modellen lærer af output fra eksisterende AI'er for at presse maksimal værdi ud af hver GPU-time.

R1's træningsprogram var open source i sin kerne og designet til effektivitet og inkluderede elementer hentet fra modeller som Metas Llama, hvilket forstærkede både dens ydeevne og kontroversen omkring dens metoder.

Resultatet? En model, der konkurrerer med meget dyrere amerikanske LLM'er, alle produceret under skyen af strenge chiprestriktioner og konstant årvågen konkurrence.

DeepSeek's hemmelige sauce ser ud til at være en blanding af teknisk smidighed og en parathed til at skubbe grænser, selvom kritikere og globale rivaler sætter spørgsmålstegn ved tilgangen og debatterer etikken i at "destillere" viden fra AI-giganterne.

Med grundlæggeren Liang Wenfeng stadig for det meste bag kulisserne, er DeepSeeks afsløring lige så meget et markedssignal som en pressemeddelelse: værdiligningen i AI ændrer sig hurtigt.

Kinas AI-kapløb i en verden i forandring

Implikationerne af DeepSeek's bedrift stikker meget dybere end teknologikredse.

Det kommer, netop som Kina strammer skruerne på Nvidia og udsteder et forbud mod førende indenlandske teknologifirmaer, der bruger den amerikanske chipproducents avancerede AI-hardware og hurtig understøttelse af lokale mestre som Huawei og Cambricon.

Kinas AI-sektor mister adgangen til Nvidias bedste chips og skifter til hjemmelavede processorer, en enorm udfordring, men en, der begynder at levere reelle resultater, da Cambricon bogfører rekordoverskud, og Huaweis Ascend-chips bevæger sig ind i top-tier datacentre.

For amerikanske og globale investorer er chokket reelt: DeepSeeks billige gennembrud slettede hundredvis af milliarder fra Nvidias værdi på en enkelt dag og genoplivede debatter om intellektuel ejendomsret, nationale fordele og fremtiden for open source-innovation.

Mens Beijings ambitioner kolliderer med amerikanske handelsmure, er DeepSeeks $294.000-model en højlydt påmindelse om, at det næste spring inden for AI kan handle lige så meget om effektivitet og opfindsomhed, som det handler om rå muskler eller købekraft.