Kiinan DeepSeek kouluttaa Nvidia-käyttöistä R1 AI:ta vain 294 000 dollarilla: tässä on mitä se tarkoittaa

  • DeepSeekin R1 harjoitteli 294 000 dollarilla 512 Nvidia H800 -grafiikkasuorittimella, mikä uhmasi kalliita länsimaisia tekoälynormeja.
  • Avoimen lähdekoodin suunnittelu laaman inspiroimilla menetelmillä herättää keskustelua etiikasta ja suorituskyvystä.
  • Kiina tukee Huawei- ja Cambricon-siruja, kun tekoälysektori sopeutuu Yhdysvaltain vientirajoituksiin.

Kiinalainen DeepSeek ravisteli juuri tekoälymaailmaa paljastamalla, että se koulutti uuden R1-mallinsa leuat loksauttavaan 294 000 dollariin, mikä on murto-osa lännessä nähdyistä silmiä hivelevistä kustannuksista.

Tässä liikkeessä ei ole kyse vain dollareista; se asettaa DeepSeekin generatiivisen tekoälyvallankumouksen ytimeen, jossa kohtuuhintaisuus kohtaa huippuluokan suorituskyvyn ja maailmanlaajuinen nokkimisjärjestys on yhtäkkiä muutoksessa.

DeepSeekin kustannuksia murskaava tekoälyprojekti: Mitä se tarkoittaa?

Tarina DeepSeekin viimeisimmän harppauksen takana on merkittävä.

Tällä viikolla vertaisarvioidussa Nature-lehdessä julkaistu DeepSeek paljasti, että sen "päättelykeskeisen" R1-mallin kouluttaminen maksoi vain 294 000 dollaria, mikä on hämmästyttävä kontrasti OpenAI:lle ja Googlelle, joiden ponnistelut voivat nousta satoihin miljooniin.

Hangzhoussa toimiva tiimi luotti 512 Nvidian H800-grafiikkasuorittimeen, Kiinan kanssa yhteensopivaan siruun, joka on suunniteltu vientiin Yhdysvaltain teknologiarajoitusten aikana, ja käytti tekniikoita, kuten tislausta, jossa malli oppii olemassa olevien tekoälyjen tuloksista puristaakseen maksimaalisen arvon jokaisesta GPU-tunnista.

R1:n ytimessä avoimen lähdekoodin ja tehokkuutta varten suunniteltu harjoitusohjelma sisälsi elementtejä, jotka oli poimittu Metan Llaman kaltaisista malleista, mikä vahvisti sekä sen suorituskykyä että sen menetelmiin liittyvää kiistaa.

Lopputulos? Malli, joka kilpailee paljon kalliimpien amerikkalaisten LLM:ien kanssa, jotka kaikki on valmistettu tiukkojen sirurajoitusten ja aina valppaan kilpailun pilvessä.

DeepSeekin salainen kastike näyttää olevan sekoitus teknistä ketteryyttä ja valmiutta rikkoa rajoja, vaikka kriitikot ja globaalit kilpailijat kyseenalaistavat tekoälyjättiläisten tiedon "tislaamisen" lähestymistavan ja keskustelevat sen etiikasta.

Perustaja Liang Wenfeng on edelleen enimmäkseen kulissien takana, joten DeepSeekin paljastus on yhtä paljon markkinasignaali kuin lehdistötiedote: tekoälyn arvoyhtälö muuttuu nopeasti.

Kiinan tekoälykilpailu muuttuvassa maailmassa

DeepSeekin saavutuksen seuraukset ovat paljon syvempiä kuin teknologiapiirit.

Se saapuu juuri kun Kiina kiristää Nvidian ruuveja ja kieltää johtavia kotimaisia teknologiayrityksiä käyttämästä amerikkalaisen siruvalmistajan kehittynyttä tekoälylaitteistoa ja nopeaa tukea paikallisille mestareille, kuten Huaweille ja Cambriconille.

Kiinan tekoälysektori menettää pääsyn Nvidian parhaisiin siruihin, ja se on siirtymässä kotimaisiin prosessoreihin, mikä on valtava haaste, mutta se alkaa tuottaa todellisia tuloksia, kun Cambricon tekee ennätysvoittoja ja Huawein Ascend-sirut siirtyvät huipputason datakeskuksiin.

Yhdysvaltalaisille ja globaaleille sijoittajille shokki on todellinen: DeepSeekin edullinen läpimurto pyyhki satoja miljardeja Nvidian arvosta yhdessä päivässä ja herätti uudelleen keskustelut immateriaalioikeuksista, kansallisesta edusta ja avoimen lähdekoodin innovaatioiden tulevaisuudesta.

Kun Pekingin tavoitteet törmäävät Yhdysvaltain kauppamuureihin, DeepSeekin 294 000 dollarin malli on äänekäs muistutus siitä, että tekoälyn seuraava harppaus voi olla yhtä paljon tehokkuutta ja kekseliäisyyttä kuin raakaa lihasta tai ostovoimaa.