NVIDIA, yapay zekâ dünyasında çığır açacak yeni açık kaynak model ailesi Llama-Nemotron’u tanıttı. Üç farklı boyutta sunulan (Nano 8B, Super 49B, Ultra 253B) bu modeller, hem akıl yürütme gücü hem de verimli çıkarım (inference) performansı ile dikkat çekiyor. Llama-Nemotron serisi, Llama 3 mimarisine dayalı olarak Puzzle çerçevesi ile optimize edilerek donanım dostu hale getirildi.
En güçlü model LN-Ultra, DeepSeek-R1 gibi rakiplerini geride bırakarak GPQA-Diamond ve MATH500 gibi zorlu bilimsel ve matematiksel testlerde birinci sıraya yerleşti. Üstelik bu model, kullanıcılara “detailed thinking on/off” komutuyla sohbet veya derin akıl yürütme modları arasında geçiş yapma imkânı tanıyor.
Tüm modeller NVIDIA Open Model License kapsamında ticari kullanıma açıkken, eğitim verisi (Llama-Nemotron-Post-Training-Dataset) ve eğitim kodları (NeMo, NeMo-Aligner, Megatron-LM) da açık kaynaklı olarak paylaşıldı. Bu adım, kurumların yüksek performanslı yapay zekâ çözümlerini özelleştirerek geliştirmesine olanak tanıyacak.
LN-Ultra, Puzzle mimarisiyle donatılarak FFN Fusion tekniğiyle katman derinliği optimize edildi, FP8 üretim ile %80’e varan hız kazanımı sağlandı. Super ve Ultra sürümler, bir adet NVIDIA H100 ya da bir 8xH100 sunucu düğümünde rahatlıkla çalışabiliyor. Bu sayede yüksek doğruluk, düşük gecikme ve ölçeklenebilirlik bir araya getiriliyor.
Derin akıl yürütme yeteneklerini desteklemek için denetimli ince ayar (SFT) ve büyük ölçekli pekiştirmeli öğrenme (RL) adımlarını kullanan NVIDIA, bu modellerle açık kaynak topluluğuna şimdiye kadarki en güçlü akıl yürütme yeteneğini sunmayı hedefliyor. NVIDIA’nın yeni Llama-Nemotron ailesi, hem akademide hem de kurumsal uygulamalarda yeni bir dönemi başlatıyor