
Geçtiğimiz günlerde rakip yapay zeka modellerinin peş peşe duyurulmasının ardından, Fransız yapay zeka şirketi Mistral AI, iddialı yeni ürününü tanıttı: Mistral 3. Bu yeni nesil modeller, açık kaynaklı yapay zeka alanında Fransa'nın gücünü bir kez daha ortaya koyarken, piyasadaki en gelişmiş kapalı kaynaklı modellere de ciddi bir rakip olarak konumlanıyor. Dün duyurulan Deepseek V3.2'nin ardından Mistral AI'dan gelen bu hamle, yapay zeka yarışının ne kadar hızlı ilerlediğini gözler önüne seriyor.
Mistral 3 ailesi, iki ana bölümden oluşuyor: bir yandan şirketlerin özel ihtiyaçlarına yönelik optimize edilmiş, son derece yetenekli "Ministral" modelleri, diğer yandan ise sektördeki en iyilerden biri olarak kabul edilen "Mistral Large 3" öncü modeli. Mistral Large 3, özellikle imaj anlama ve çok dilli sohbetlerde gösterdiği başarıyla dikkat çekiyor. Bu model, 41 milyar aktif ve toplamda 675 milyar parametre ile eğitilmiş, yeni nesil bir "mixture-of-experts" (uzmanlar karışımı) mimarisine sahip.
Mistral'ın yeni modelleri, açık kaynak felsefesini benimseyerek geliştirildi ve Apache 2.0 lisansı altında yayınlandı. Bu sayede geliştirici topluluğu, bu güçlü araçları özgürce kullanabilir, üzerinde değişiklik yapabilir ve kendi uygulamalarına entegre edebilir. Özellikle Ministral modelleri, en iyi performans-maliyet oranını sunmayı hedefliyor. Bunlar arasında 3 milyar, 8 milyar ve 14 milyar parametrelik farklı boyutlarda sunulan ve her biri görüntü anlama yeteneğine sahip temel, talimat ve akıl yürütme varyantları bulunuyor. Bu modellerin, düşük gecikme süreleri ve maliyet etkinlikleriyle öne çıkması bekleniyor.
Mistral Large 3'ün en dikkat çekici başarılarından biri, LM Arena veritabanı üzerinde açık kaynaklı modeller arasında ikinci sıraya yerleşmesi. OpenAI'nin GPT-4'ünden sonra genel amaçlı API aracılığıyla ulaşılabilir modeller arasında en üst sıralarda yer alması, Mistral AI'ın ne kadar önemli bir başarıya imza attığının göstergesi. Şirket, bu modelleri NVIDIA'nın en yeni H200 GPU'ları üzerinde eğittiğini ve vLLM, Red Hat gibi teknoloji devleriyle iş birliği yaparak erişilebilirliği ve performansı en üst düzeye çıkardığını belirtiyor. Bu iş birlikleri, Mistral 3 modellerinin hem veri merkezlerinde hem de uç cihazlarda verimli bir şekilde çalışmasını sağlıyor.