OpenAI, Açık Ağırlık modellerini piyasaya sürecek: ne oldukları ve neden her şeyi değiştirdiği

OpenAI, Açık Ağırlık modellerini piyasaya sürecek: ne oldukları ve neden her şeyi değiştirdiği
Devesh Kumar
05 Ağu 2025, 20:43 ÖS
  • GPT-OSS-120B ve 20B, OpenAI'nin altı yıl içindeki ilk açık ağırlıklı modelleridir.
  • Apache 2.0 altında yayınlandı ve tam kullanıma, değişikliğe ve dağıtıma izin verdi.
  • Modeller, akıl yürütme, kodlama ve matematik karşılaştırmalarında tescilli GPT modellerine rakip olur.

OpenAI, yıllardır yapmadığı bir şeyi yaptı: açık kaynaklı dil modellerini piyasaya sürdü.

Bu en son 2019'da GPT-2 ile oldu. Şimdi elimizde iki yeni tane var: gpt-oss-120b ve gpt-oss-20b.

Bu sefer farklı olan ne? Apache 2.0 lisansı altında piyasaya sürülüyorlar, bu da temelde herkesin onları istediği gibi kullanabileceği, değiştirebileceği ve çalıştırabileceği anlamına geliyor. Bu, son zamanlarda işleri çoğunlukla kapalı tutan bir şirketten oldukça beklenmedik bir hareket.

Açık Ağırlık modelleri nelerdir?

Açık ağırlık modelleri, modelin eğitim sırasında öğrendiği temel sayılar olan gerçek "ağırlıkların" herkese açık hale getirildiği yapay zeka sistemleridir . Bu ağırlıklar, modelin tahminlerini, yanıtlarını ve genel davranışını yönlendiren şeydir.

Yalnızca API'ler veya web hizmetleri aracılığıyla erişebileceğiniz GPT-4 veya Claude gibi kapalı modellerin aksine, açık ağırlıklı modeller kullanıcılara gerçek özgürlük verir. Kullanıcılar şunları yapabilir:

  • İster kişisel bir bilgisayar, ister bir ofis sunucusu, hatta bir telefon olsun, bunları kendi donanımınızda indirin ve çalıştırın
  • Belirli görevler için daha iyi sonuçlar elde etmek için kendi verilerinizle ince ayar yapın
  • Kaputun altına göz atın ve model mimarisinin kendisiyle oynayın
  • Erişim için ödeme yapmanıza veya üçüncü taraf bir platforma güvenmenize gerek kalmadan bunları istediğiniz gibi kullanın

Bununla birlikte, "açık ağırlık" tamamen açık kaynak anlamına gelmez. Kullanıcılar modelin ağırlıklarını alır, ancak her zaman onu oluşturmak için kullanılan eğitim kodunu veya tam veri kümesini almaz.

Bu nedenle, kullanıcılar kontrol ve şeffaflık elde ettikçe bu bir uzlaşmadır, ancak şirketler, genellikle mülkiyet veya güvenlik nedenleriyle eğitim sürecinin bazı kısımlarını hala özel tutar.

OpenAI'nin hamlesi neden her şeyi değiştirecek?

Şimdiye kadar, OpenAI'nin en güçlü modelleri, yalnızca büyük şirketler veya iyi finanse edilen kullanıcılar tarafından erişilebilen ücretli API'lerin arkasında kilitliydi. Şirket, güvenlik endişelerini dile getirdi, ancak sonuç, daha geniş geliştirici ve araştırma topluluğu için sınırlı erişim oldu.

Bu değişiyor. Açık ağırlıklı modellerin piyasaya sürülmesiyle OpenAI, bağımsız geliştiricilere, araştırmacılara ve yeni başlayanlara, gizlilik nedenleri, maliyet tasarrufu veya yalnızca kurcalama özgürlüğü nedeniyle son teknoloji yapay zekayı yerel olarak çalıştırmaları için araçlar sağlıyor.

Bu modeller, yasal tavsiye ve tıbbi destekten bölgesel dillere ve özel kodlama görevlerine kadar her şey için ince ayar yapılabilir.

Merkezi bir ekipten izin veya güncelleme beklemeye gerek yok, kullanıcılar kendi şartlarına göre özelleştirebilir ve dağıtabilir.

Aynı zamanda şeffaflık için de bir kazançtır. Açık ağırlıklar, araştırmacıların modellerin nasıl çalıştığını araştırmalarına, önyargıyı test etmelerine ve güvenlik sorunlarını kontrol etmelerine olanak tanır. Bu tür bir görünürlük güven oluşturur.

Bu hamle aynı zamanda Meta, Mistral ve DeepSeek'in artan rekabetine de yanıt olarak görülüyor. Ancak sebep ne olursa olsun, sonuç aynı: Artık daha fazla yerde, daha fazla insan güçlü yapay zeka teknolojisinden yararlanabilir ve daha önce mümkün olmayan şeyleri inşa edebilir.

Açık Ağırlık modellerine nasıl erişilir?

OpenAI, en son modellerini Hugging Face ve GitHub'da ücretsiz olarak indirilebilir hale getirdi. 16 – 80 GB belleğe sahip donanım üzerinde çalışırlar ve tamamen özelleştirilebilir, akıl yürütme, talimat izleme ve kod yürütme gibi görevler için idealdir ve belirli endüstriler veya diller için ince ayar yapılmıştır.

OpenAI, bu modelleri açık bir şekilde yayınlayarak, gücü bir avuç büyük teknoloji firmasından dünyanın dört bir yanındaki geliştiricilere, yeni başlayanlara ve araştırmacılara kaydırıyor.

Bu, daha hızlı inovasyon, daha güçlü güvenlik testleri ve daha kısa sürede daha fazla deneme yapılması anlamına gelir. Araştırmacılar artık başka birinin yol haritasını beklemeden modellerin nasıl çalıştığını inceleyebilir, önyargı bulabilir veya yeni özellikler oluşturabilir.