OpenAI släpper modeller med öppen vikt: vad de är och varför det förändrar allt

OpenAI släpper modeller med öppen vikt: vad de är och varför det förändrar allt
Devesh Kumar
05 aug. 2025, 19:43 EM
  • GPT-OSS-120B och 20B är OpenAI:s första modeller med öppen vikt på sex år.
  • Släpptes under Apache 2.0, vilket möjliggör full användning, modifiering och distribution.
  • Modellerna konkurrerar med proprietära GPT-modeller när det gäller benchmarks för resonemang, kodning och matematik.

OpenAI gjorde precis något som de inte har gjort på flera år: de släppte språkmodeller med öppen källkod.

Senast detta hände var med GPT-2 2019. Nu har vi två nya: gpt-oss-120b och gpt-oss-20b.

Vad är annorlunda den här gången? De släpps under Apache 2.0-licensen, vilket i princip innebär att vem som helst kan använda, modifiera och köra dem hur de vill. Det är ett ganska oväntat drag från ett företag som för det mesta har hållit saker stängda på sistone.

Vad är modeller med öppen vikt?

Öppna viktmodeller är AI-system där de faktiska "vikterna", de kärntal som modellen lärt sig under träningen, offentliggörs. Dessa vikter är det som driver modellens förutsägelser, svar och övergripande beteende.

Till skillnad från slutna modeller som GPT-4 eller Claude, som du bara kan komma åt via API:er eller webbtjänster, ger öppna modeller användarna verklig frihet. Användarna kan:

  • Ladda ner och kör dem på din egen hårdvara, oavsett om det är en persondator, en kontorsserver eller till och med en telefon
  • Finjustera dem med dina egna data för att få bättre resultat för specifika uppgifter
  • Kika under huven och lek med själva modellarkitekturen
  • Använd dem hur du vill, utan att behöva betala för åtkomst eller förlita dig på en tredjepartsplattform

Med det sagt betyder "öppen vikt" inte helt öppen källkod. Användarna får modellens vikter, men inte alltid träningskoden eller den fullständiga datauppsättningen som används för att skapa den.

Så det är en kompromiss eftersom användarna får kontroll och transparens, men företagen håller fortfarande delar av utbildningsprocessen privat, ofta av proprietära eller säkerhetsskäl.

Varför kommer OpenAI:s drag att förändra allt?

Hittills har OpenAI:s mest kraftfulla modeller varit låsta bakom betalda API:er, som endast är tillgängliga för stora företag eller välfinansierade användare. Företaget hänvisade till säkerhetsproblem, men resultatet blev begränsad tillgång för den bredare utvecklaren och forskarsamhället.

Det håller på att förändras. Med lanseringen av modeller med öppen vikt ger OpenAI oberoende utvecklare, forskare och nystartade företag verktygen för att köra banbrytande AI lokalt, oavsett om det är av integritetsskäl, kostnadsbesparingar eller bara friheten att pyssla.

Dessa modeller kan finjusteras för allt från juridisk rådgivning och medicinskt stöd till regionala språk och specialiserade kodningsuppgifter.

Du behöver inte vänta på tillstånd eller uppdateringar från ett centralt team, användarna kan anpassa och distribuera på sina egna villkor.

Det är också en vinst för transparensen. Öppna vikter gör det möjligt för forskare att gräva i hur modellerna fungerar, testa för bias och kontrollera säkerhetsproblem. Den typen av synlighet skapar förtroende.

Detta drag ses också som svar på växande konkurrens från Meta, Mistral och DeepSeek. Men oavsett anledning är resultatet detsamma: fler människor, på fler platser, kan nu utnyttja kraftfull AI-teknik och bygga saker som inte var möjliga tidigare.

Hur får man tillgång till modeller med öppen vikt?

OpenAI har gjort sina senaste modeller fritt nedladdningsbara på Hugging Face och GitHub. De körs på hårdvara med 16 – 80 GB minne och är helt anpassningsbara, idealiska för uppgifter som resonemang, instruktionsföljning och kodexekvering, och finjusterade för specifika branscher eller språk.

Genom att släppa dessa modeller öppet flyttar OpenAI makten från en handfull stora teknikföretag till utvecklare, startups och forskare runt om i världen.

Det innebär snabbare innovation, starkare säkerhetstestning och mer experimenterande som sker tidigare. Forskare kan nu inspektera hur modellerna fungerar, hitta bias eller bygga nya funktioner utan att vänta på någon annans färdplan.