
OpenAI, açık ağırlıklı yapay zeka ailesine iki yeni modeli ekledi: GPT-OSS-120B ve GPT-OSS-20B. Apache 2.0 lisansı altında ücretsiz indirilebilen modeller, şirketin GPT-2’den bu yana ilk kez açık ağırlık yayınlamasıyla stratejik bir dönüşüme işaret ediyor. Modeller Hugging Face üzerinden erişilebilir durumda; PyTorch ve Apple Metal için referans çalıştırma kodları, MXFP4 ön-kuantizasyon seçenekleriyle birlikte sunuluyor.
Her iki model de Transformer tabanlı mixture-of-experts (MoE) yaklaşımını kullanıyor. MoE, her girdi için yalnızca ilgili uzmanları etkinleştirerek aktif parametre sayısını düşürüyor; bu sayede maliyet/verim dengesi iyileşiyor. Modeller 128 bin token’a kadar bağlam penceresini destekliyor. RoPE pozisyon kodlaması, multi-query attention ve sparse attention gibi teknikler bellek ve hesaplama verimliliğini artırmak üzere entegre edilmiş.
Donanım tarafında GPT-OSS-120B, 80 GB belleğe sahip tek bir GPU üzerinde çalışabilecek şekilde optimize edilirken; GPT-OSS-20B yalnızca 16 GB bellek gereksinimiyle edge senaryolarına ve daha yaygın donanımlara uygun bir seçenek olarak öne çıkıyor. Microsoft, 20B modelini ONNX Runtime ile Windows cihazlara optimize ederken; modellerin dağıtımı için Hugging Face, Azure, AWS, Databricks, Vercel ve Cloudflare desteği açıklanmış durumda. Donanım ortaklıklarında NVIDIA, AMD, Cerebras ve Groq için optimizasyonlar yürütüldü.
Performans cephesinde OpenAI, GPT-OSS ailesinin o3, o3-mini ve o4-mini ile karşılaştırmalı testlerde güçlü sonuçlar verdiğini belirtiyor. Kod üretimi (Codeforces), akademik genel bilgi (MMLU, HLE), matematik (AIME 2024–2025), sağlık (HealthBench) ve araç çağırma/fonksiyon kullanımı (TauBench) gibi kıyaslamalarda özellikle GPT-OSS-120B’nin o4-mini’ye yakın veya yer yer daha iyi sonuçlar aldığı; 20B’nin ise birçok testte o3-mini’yi geçtiği paylaşılıyor.
Güvenlik ve sorumlu kullanım için çok katmanlı önlemler öne çıkıyor. Ön eğitim sürecinde CBRN (kimyasal, biyolojik, radyolojik, nükleer) içerikleri filtrelendi; sonradan eğitim aşamasında zararlı taleplere karşı direnç artırıldı. Kötüye kullanım değerlendirmeleri kapsamında biyoloji ve siber güvenlik gibi alanlarda reddetmeyecek şekilde eğitilmiş varyantlarla stres testleri yapıldı; bu varyantların yeteneklerinin sınırlı kaldığı ve dış bağımsız uzmanlarca denetlendiği belirtildi. Zincirleme düşünme (CoT) kapasitesi denetimsiz yöntemlerle izlenebilir hale getirildi; OpenAI, geliştiricilerin bu düşünce izlerini son kullanıcıya göstermemesini tavsiye ediyor. Ayrıca toplam 500 bin dolarlık ödül havuzuna sahip bir red teaming yarışması ile topluluk katkısı teşvik ediliyor.
Sonuç olarak GPT-OSS-120B ve GPT-OSS-20B, düşük maliyetli kurulumlardan kurumsal üretim ortamlarına kadar geniş bir yelpazede konumlanıyor. Açık lisans, optimize dağıtım seçenekleri ve rekabetçi kıyaslamalar, OpenAI’ın açık ekosisteme güçlü bir dönüş yaptığını gösteriyor.