Alibaba Sahneye Qwen3-Max'ı Çıkardı: Yapay Zeka Rekabetinde Yeni Zirve!

Çinli teknoloji devi Alibaba, yıllık Apsara Konferansı'nda yapay zeka alanındaki son ve en iddialı hamlesini gerçekleştirdi. Şirket, şimdiye kadarki en güçlü büyük dil modeli (LLM) olarak lanse edilen Qwen3-Max'ı tanıttı. Bu dev model, tam anlamıyla bir parametre devi olarak öne çıkıyor; tam 1 trilyondan fazla parametreye sahip olması, onu mevcut yapay zeka teknolojilerinin çok ötesine taşıyor. Qwen3-Max'ın tanıtımı, özellikle küresel yapay zeka yarışında Çin'in ne kadar iddialı olduğunu bir kez daha gözler önüne serdi.

Qwen3-Max'ın öne çıkan yeteneklerinden biri, kodlama ve otonom araçlar alanındaki üstün performansı olarak vurgulanıyor. Modelin "Instruct" sürümü, özellikle gerçek dünya kodlama sorunlarını çözme konusunda önde gelen bir karşılaştırma platformu olan SWE-Bench Verified'da %69.6 gibi etkileyici bir skor elde etti. Ayrıca, agent (ajan) yeteneklerini ve araçla etkileşim kabiliyetini ölçen Tau2-Bench testlerinden 74.8 gibi dikkat çekici bir puan alarak, Claude Opus 4 ve DeepSeek V3.1 gibi rakiplerini geride bıraktı. Bu başarılar, Qwen3-Max'ın hem geliştiriciler hem de karmaşık sistemler için sunduğu potansiyeli gösteriyor.

Alibaba Cloud'un yapay zeka sistemlerini ölçeklendirme stratejisinin bir parçası olarak geliştirilen Qwen3-Max-Base, 36 trilyon token üzerinde eğitildi. Modelin kararlı ve verimli eğitim süreci, Mixture of Experts (MoE) mimarisi ve PAI-FlashMoE gibi gelişmiş teknolojiler sayesinde mümkün oldu. Bu sayede, Qwen3-Max-Base, eğitim verimliliğinde Qwen2.5-Max-Base'e kıyasla %30'luk bir artış sağladı. Uzun bağlam pencereleriyle başa çıkabilme yeteneği de dikkat çekici; ChunkFlow stratejisi sayesinde 1 milyon token'lık bir bağlam uzunluğunda sorunsuz eğitim gerçekleştirebiliyor. Bu özellikler, modelin daha karmaşık ve uzun metinlerle daha etkili çalışmasını sağlıyor.

Şirket, geleceğe yönelik bir hamle olarak Qwen3-Max-Thinking adlı, henüz eğitiminin son aşamasında olan bir versiyon üzerinde de çalışmalarını sürdürüyor. Bu versiyonun, kod yorumlayıcısı ve paralel test zamanı hesaplama teknikleri ile desteklendiğinde, AIME 25 ve HMMT gibi zorlu matematiksel akıl yürütme görevlerinde %100'lük bir başarı oranına ulaştığı belirtildi. Qwen3-Max-Instruct, halihazırda Qwen Chat üzerinden denenebilirken, API erişimi de Alibaba Cloud üzerinden kullanıcılara sunulmuş durumda. Alibaba'nın bu yeni büyük dil modeliyle yapay zeka ekosistemindeki ağırlığını daha da artırması bekleniyor.

Kategoriler

Dil

Alibaba Sahneye Qwen3-Max'ı Çıkardı: Yapay Zeka Rekabetinde Yeni Zirve!

Kategoriler

Dil

Alibaba Sahneye Qwen3-Max'ı Çıkardı: Yapay Zeka Rekabetinde Yeni Zirve!

📬 Bültenimize Abone Olun