Çinli yapay zeka teknoloji şirketi MiniMax AI, 17 Haziran’da dünyanın ilk açık ağırlıklı ve büyük ölçekli hibrit dikkat mimarisine sahip dil modeli olan MiniMax-M1’i duyurdu. Tam 456 milyar parametreye ve 1 milyon tokenlık rekor bağlam penceresine sahip bu yeni model, kuruluşların ve geliştiricilerin karmaşık, uzun metinler üzerinde daha yüksek doğrulukla çalışmasına imkân tanıyor. MiniMax-M1, son teknoloji “lightning attention” adı verilen hızlı dikkat mekanizması ve GRPO'nun yenilikçi bir varyantı olan CISPO algoritmasıyla güçlendiriliyor. Bu sayede, önceki rakiplerine kıyasla 100 bin token üretiminde yalnızca %25 işlem gücü gerektiriyor ve büyük ölçekte kodlama, matematiksel muhakeme ve araç kullanımı gerektiren görevlerde üstün başarı gösteriyor.
MiniMax-M1, temel olarak karmaşık senaryolarda üretkenliği artırmaya odaklanıyor ve açık kaynak erişimi sayesinde tamamen ücretsiz olarak ticari uygulamalarda kullanılabiliyor ya da geliştirilebiliyor. Model, 40 bin ve 80 bin “düşünme bütçesine” sahip iki varyantla sunuluyor ve matematik, yazılım mühendisliği, genel kodlama ve uzun bağlam gerektiren görevlerde piyasadaki diğer açık kaynaklı modeller olan DeepSeek R1 ve Qwen3-235B’den daha iyi performans sergiliyor.
MiniMax AI ayrıca, ByteDance’in Seedance’ına rakip olabilecek yeni video modeli Hailuo 02 (0616) ve kodlama alanında DeepSeek R1’den daha iyi performans sunan Moonshot AI’ın Kimi-Dev-72B modelini de duyurdu. MiniMax, API ve sohbet robotu servisleriyle geliştiricilere hızlı ve güvenli altyapı desteği de sunuyor. MiniMax-M1’in tüm teknik dökümantasyonu ve dağıtım rehberleri, HuggingFace ve GitHub üzerinden herkesin erişimine açık bulunuyor.
Yapay zeka alanında Asya’nın öncü firmalarından olan MiniMax, “herkesin zekâdan faydalanacağı bir dünya” vizyonuyla geliştirdiği MiniMax-M1 ile, ileri seviye yapay zeka çalışmalarında yeni bir çağ başlatmayı hedefliyor.