OpenAI julkaisee Open-Weight-malleja: mitä ne ovat ja miksi se muuttaa kaiken

OpenAI teki juuri jotain, mitä se ei ole tehnyt vuosiin: se julkaisi avoimen lähdekoodin kielimalleja.

Viimeksi näin tapahtui GPT-2:n kanssa vuonna 2019. Nyt meillä on kaksi uutta: gpt-oss-120b ja gpt-oss-20b.

Mikä on erilaista tällä kertaa? Ne julkaistaan Apache 2.0 -lisenssillä, mikä tarkoittaa periaatteessa sitä, että kuka tahansa voi käyttää, muokata ja ajaa niitä haluamallaan tavalla. Se on melko odottamaton siirto yritykseltä, joka on viime aikoina enimmäkseen pitänyt asiat suljettuina.

Mitä ovat Open-Weight-mallit?

Avoimen painon mallit ovat tekoälyjärjestelmiä , joissa todelliset "painot", mallin koulutuksen aikana oppimat ydinluvut, julkistetaan. Nämä painot ohjaavat mallin ennusteita, vastauksia ja yleistä käyttäytymistä.

Toisin kuin suljetut mallit, kuten GPT-4 tai Claude, joita voit käyttää vain sovellusliittymien tai verkkopalvelujen kautta, avoimen painon mallit antavat käyttäjille todellista vapautta. Käyttäjät voivat:

Lataa ja suorita ne omalla laitteistollasi, olipa kyseessä sitten henkilökohtainen tietokone, toimistopalvelin tai jopa puhelin
Hienosäädä niitä omilla tiedoillasi saadaksesi parempia tuloksia tietyissä tehtävissä
Kurkista konepellin alle ja leikittele itse malliarkkitehtuurilla
Käytä niitä haluamallasi tavalla ilman, että sinun tarvitsee maksaa pääsystä tai luottaa kolmannen osapuolen alustaan

"Avoin paino" ei kuitenkaan tarkoita täysin avointa lähdekoodia. Käyttäjät saavat mallin painot, mutta eivät aina harjoituskoodia tai koko tietojoukkoa, jota käytetään sen rakentamiseen.

Joten se on kompromissi, koska käyttäjät saavat hallinnan ja läpinäkyvyyden, mutta yritykset pitävät silti osan koulutusprosessista yksityisenä, usein omistusoikeudellisista tai turvallisuussyistä.

Miksi OpenAI:n siirto muuttaa kaiken?

Tähän asti OpenAI:n tehokkaimmat mallit olivat lukittuina maksullisten sovellusliittymien taakse, ja ne olivat vain suurten yritysten tai hyvin rahoitettujen käyttäjien käytettävissä. Yhtiö vetosi turvallisuusongelmiin, mutta seurauksena oli rajoitettu pääsy laajemmalle kehittäjä- ja tutkimusyhteisölle.

Se on muuttumassa. Avoimen painon mallien julkaisun myötä OpenAI antaa itsenäisille kehittäjille, tutkijoille ja startup-yrityksille työkalut huippuluokan tekoälyn käyttämiseen paikallisesti, olipa kyse sitten yksityisyyssyistä, kustannussäästöistä tai vain vapaudesta puuhastella.

Näitä malleja voidaan hienosäätää kaikkeen oikeudellisesta neuvonnasta ja lääketieteellisestä tuesta alueellisiin kieliin ja erikoistuneisiin koodaustehtäviin.

Sinun ei tarvitse odottaa lupaa tai päivityksiä keskitetyltä tiimiltä, käyttäjät voivat mukauttaa ja ottaa käyttöön omilla ehdoillaan.

Se on myös voitto läpinäkyvyydelle. Avoimien painojen avulla tutkijat voivat kaivaa mallien toimintaa, testata ennakkoluuloja ja tarkistaa turvallisuusongelmia. Tällainen näkyvyys rakentaa luottamusta.

Tämä siirto näkyy myös vastauksena Metan, Mistralin ja DeepSeekin kasvavaan kilpailuun. Mutta syystä riippumatta lopputulos on sama: useammat ihmiset useammissa paikoissa voivat nyt hyödyntää tehokasta tekoälyteknologiaa ja rakentaa asioita, jotka eivät olleet aiemmin mahdollisia.

Kuinka käyttää Open-Weight-malleja?

OpenAI on tehnyt uusimmista malleistaan ilmaiseksi ladattavissa Hugging Facesta ja GitHubista. Ne toimivat laitteistolla, jossa on 16–80 Gt muistia, ja ne ovat täysin muokattavissa, ihanteellisia tehtäviin, kuten päättelyyn, ohjeiden seuraamiseen ja koodin suorittamiseen, ja ne on hienosäädetty tietyille toimialoille tai kielille.

Julkaisemalla nämä mallit avoimesti OpenAI siirtää valtaa kourallisesta suuria teknologiayrityksiä kehittäjille, startup-yrityksille ja tutkijoille ympäri maailmaa.

Tämä tarkoittaa nopeampaa innovointia, vahvempaa tietoturvatestausta ja enemmän kokeiluja nopeammin. Tutkijat voivat nyt tarkastaa, miten mallit toimivat, löytää ennakkoluuloja tai rakentaa uusia ominaisuuksia odottamatta jonkun toisen etenemissuunnitelmaa.

OpenAI julkaisee Open-Weight-malleja: mitä ne ovat ja miksi se muuttaa kaiken

Mitä ovat Open-Weight-mallit?

Miksi OpenAI:n siirto muuttaa kaiken?

Kuinka käyttää Open-Weight-malleja?

Celestican osake noussut 125 % 12 kuukaudessa — lisää nousuvaraa?

Nvidia-osake hakee tukea ja muodostaa nousumallin arvostuksen laskiessa

Palo Alto Networks -osakkeen keskeinen riski tänään

Sandiskin osake: karhumainen divergenssi ja riskialtis Wyckoff-vaihe

Micronin osake menettänyt vauhtia tekoälykupla-pelon vuoksi: osta, myy vai pidä?