OpenAI veröffentlicht Open-Weight-Modelle: Was sie sind und warum sie alles verändern

  • GPT-OSS-120B und 20B sind die ersten Open-Weight-Modelle von OpenAI seit sechs Jahren.
  • Veröffentlicht unter Apache 2.0 und ermöglicht die vollständige Nutzung, Änderung und Bereitstellung.
  • Modelle konkurrieren mit proprietären GPT-Modellen in den Bereichen Argumentation, Codierung und Mathematik.

OpenAI hat gerade etwas getan, was es seit Jahren nicht mehr getan hat: Es hat Open-Source-Sprachmodelle veröffentlicht.

Das letzte Mal, dass dies geschah, war mit GPT-2 im Jahr 2019. Jetzt haben wir zwei neue: gpt-oss-120b und gpt-oss-20b.

Was ist dieses Mal anders? Sie werden unter der Apache 2.0-Lizenz veröffentlicht, was im Grunde bedeutet, dass jeder sie nach Belieben verwenden, modifizieren und ausführen kann. Es ist ein ziemlich unerwarteter Schritt von einem Unternehmen, das die Dinge in letzter Zeit meist unter Verschluss gehalten hat.

Was sind Open-Weight-Modelle?

Open-Weight-Modelle sind KI-Systeme , bei denen die eigentlichen "Gewichte", also die Kernzahlen, die das Modell während des Trainings gelernt hat, veröffentlicht werden. Diese Gewichtungen sind es, die die Vorhersagen, Antworten und das Gesamtverhalten des Modells steuern.

Im Gegensatz zu geschlossenen Modellen wie GPT-4 oder Claude, auf die Sie nur über APIs oder Webdienste zugreifen können, bieten Open-Weight-Modelle den Benutzern echte Freiheiten. Die Benutzer können:

  • Laden Sie sie herunter und führen Sie sie auf Ihrer eigenen Hardware aus, egal ob es sich um einen PC, einen Büroserver oder sogar ein Telefon handelt
  • Optimieren Sie sie mit Ihren eigenen Daten, um bessere Ergebnisse für bestimmte Aufgaben zu erzielen
  • Werfen Sie einen Blick unter die Haube und spielen Sie mit der Modellarchitektur selbst herum
  • Verwenden Sie sie, wie Sie möchten, ohne für den Zugang bezahlen zu müssen oder sich auf eine Plattform eines Drittanbieters verlassen zu müssen

Allerdings bedeutet "Open-Weight" nicht, dass es vollständig Open Source ist. Die Benutzer erhalten die Gewichtungen des Modells, aber nicht immer den Trainingscode oder das vollständige Dataset, das zum Erstellen des Modells verwendet wurde.

Es ist also ein Kompromiss, da die Benutzer Kontrolle und Transparenz erhalten, die Unternehmen aber immer noch Teile des Schulungsprozesses privat halten, oft aus proprietären oder Sicherheitsgründen.

Warum wird der Schritt von OpenAI alles verändern?

Bisher waren die leistungsstärksten Modelle von OpenAI hinter kostenpflichtigen APIs verborgen, die nur für große Unternehmen oder gut finanzierte Nutzer zugänglich waren. Das Unternehmen berief sich auf Sicherheitsbedenken, aber das Ergebnis war ein eingeschränkter Zugang für die breitere Entwickler- und Forschungsgemeinschaft.

Das ändert sich gerade. Mit der Veröffentlichung von Open-Weight-Modellen gibt OpenAI unabhängigen Entwicklern, Forschern und Startups die Werkzeuge an die Hand, um hochmoderne KI lokal auszuführen, sei es aus Gründen des Datenschutzes, zur Kosteneinsparung oder einfach nur zur Freiheit zum Basteln.

Diese Modelle können für alles fein abgestimmt werden, von der Rechtsberatung und medizinischen Unterstützung bis hin zu Regionalsprachen und speziellen Codierungsaufgaben.

Sie müssen nicht auf Genehmigungen oder Aktualisierungen von einem zentralen Team warten, die Benutzer können sie nach ihren eigenen Bedingungen anpassen und bereitstellen.

Es ist auch ein Gewinn für die Transparenz. Offene Gewichte ermöglichen es Forschern, die Funktionsweise der Modelle zu untersuchen, auf Verzerrungen zu testen und nach Sicherheitsproblemen zu suchen. Diese Art von Transparenz schafft Vertrauen.

Dieser Schritt ist auch eine Reaktion auf die wachsende Konkurrenz von Meta, Mistral und DeepSeek. Aber egal aus welchem Grund, das Ergebnis ist dasselbe: Mehr Menschen an mehr Orten können jetzt leistungsstarke KI-Technologie nutzen und Dinge entwickeln, die vorher nicht möglich waren.

Wie greife ich auf Open-Weight-Modelle zu?

OpenAI hat seine neuesten Modelle auf Hugging Face und GitHub zum kostenlosen Download bereitgestellt. Sie laufen auf Hardware mit 16 bis 80 GB Arbeitsspeicher und sind vollständig anpassbar, ideal für Aufgaben wie Argumentation, Befolgung von Anweisungen und Codeausführung und fein abgestimmt auf bestimmte Branchen oder Sprachen.

Durch die offene Veröffentlichung dieser Modelle verlagert OpenAI die Macht von einer Handvoll großer Technologieunternehmen auf Entwickler, Start-ups und Forscher auf der ganzen Welt.

Das bedeutet schnellere Innovationen, stärkere Sicherheitstests und mehr Experimente, die früher stattfinden. Forscher können jetzt überprüfen, wie die Modelle funktionieren, Verzerrungen finden oder neue Funktionen entwickeln, ohne auf die Roadmap anderer warten zu müssen.