OpenAI brengt Open-Weight-modellen uit: wat ze zijn en waarom het alles verandert

  • GPT-OSS-120B en 20B zijn de eerste open-weight modellen van OpenAI in zes jaar.
  • Uitgebracht onder Apache 2.0, waardoor volledig gebruik, wijziging en implementatie mogelijk is.
  • Modellen wedijveren met eigen GPT-modellen op het gebied van redeneren, coderen en wiskundige benchmarks.

OpenAI deed gewoon iets wat het in jaren niet heeft gedaan: het bracht open-source taalmodellen uit.

De laatste keer dat dit gebeurde was met GPT-2 in 2019. Nu hebben we twee nieuwe: gpt-oss-120b en gpt-oss-20b.

Wat is er deze keer anders? Ze worden vrijgegeven onder de Apache 2.0-licentie, wat in feite betekent dat iedereen ze kan gebruiken, wijzigen en uitvoeren zoals ze willen. Het is een vrij onverwachte zet van een bedrijf dat de laatste tijd vooral de zaken gesloten houdt.

Wat zijn modellen met open gewicht?

Open-weight modellen zijn AI-systemen waarbij de werkelijke 'gewichten', de kernnummers die het model tijdens de training heeft geleerd, openbaar worden gemaakt. Deze gewichten zijn de drijvende kracht achter de voorspellingen, reacties en het algehele gedrag van het model.

In tegenstelling tot gesloten modellen zoals GPT-4 of Claude, waartoe je alleen toegang hebt via API's of webservices, geven open-weight modellen gebruikers echte vrijheid. De gebruikers kunnen:

  • Download en voer ze uit op uw eigen hardware, of dat nu een persoonlijke pc, een kantoorserver of zelfs een telefoon is
  • Verfijn ze met uw eigen gegevens om betere resultaten te krijgen voor specifieke taken
  • Neem een kijkje onder de motorkap en speel met de modelarchitectuur zelf
  • Gebruik ze zoals u wilt, zonder dat u hoeft te betalen voor toegang of afhankelijk bent van een platform van derden

Dat gezegd hebbende, "open-weight" betekent niet volledig open-source. De gebruikers krijgen de gewichten van het model, maar niet altijd de trainingscode of de volledige dataset die is gebruikt om het te bouwen.

Het is dus een compromis omdat gebruikers controle en transparantie krijgen, maar bedrijven houden nog steeds delen van het trainingsproces privé, vaak om eigendoms- of veiligheidsredenen.

Waarom zal de stap van OpenAI alles veranderen?

Tot nu toe zaten de krachtigste modellen van OpenAI vast achter betaalde API's, die alleen toegankelijk waren voor grote bedrijven of goed gefinancierde gebruikers. Het bedrijf noemde veiligheidsproblemen, maar het resultaat was beperkte toegang voor de bredere ontwikkelaars- en onderzoeksgemeenschap.

Dat is aan het veranderen. Met de release van open-weight modellen geeft OpenAI onafhankelijke ontwikkelaars, onderzoekers en startups de tools om geavanceerde AI lokaal uit te voeren, of het nu gaat om privacyredenen, kostenbesparingen of gewoon de vrijheid om te sleutelen.

Deze modellen kunnen worden afgestemd op alles, van juridisch advies en medische ondersteuning tot regionale talen en gespecialiseerde codeertaken.

U hoeft niet te wachten op toestemming of updates van een centraal team, de gebruikers kunnen op hun eigen voorwaarden aanpassen en implementeren.

Het is ook een overwinning voor transparantie. Met open gewichten kunnen onderzoekers graven in hoe de modellen werken, testen op vooringenomenheid en controleren op veiligheidsproblemen. Dat soort zichtbaarheid schept vertrouwen.

Deze stap wordt ook gezien als reactie op de groeiende concurrentie van Meta, Mistral en DeepSeek. Maar wat de reden ook is, de uitkomst is hetzelfde: meer mensen, op meer plaatsen, kunnen nu gebruikmaken van krachtige AI-technologie en dingen bouwen die voorheen niet mogelijk waren.

Hoe krijg ik toegang tot modellen met een open gewicht?

OpenAI heeft zijn nieuwste modellen gratis downloadbaar gemaakt op Hugging Face en GitHub. Ze draaien op hardware met 16 – 80 GB geheugen en zijn volledig aanpasbaar, ideaal voor taken zoals redeneren, het volgen van instructies en het uitvoeren van codes, en afgestemd op specifieke industrieën of talen.

Door deze modellen openlijk vrij te geven, verschuift OpenAI de macht van een handvol grote technologiebedrijven naar ontwikkelaars, startups en onderzoekers over de hele wereld.

Dat betekent snellere innovatie, sterkere beveiligingstests en meer experimenten die sneller plaatsvinden. Onderzoekers kunnen nu inspecteren hoe de modellen werken, vooroordelen vinden of nieuwe functies bouwen zonder te wachten op de roadmap van iemand anders.