
Teknoloji devi Google, yapay zeka dünyasında çığır açan yeni bir modeli kullanıcılara sundu: EmbeddingGemma. Bu son teknoloji ürünü çok dilli embedding modeli, özellikle mobil cihazlarda ve günlük kullanım senaryolarında yüksek hız ve verimlilik sunmak üzere tasarlandı. 308 milyon parametreye sahip olan EmbeddingGemma, Gemma 3 mimarisine dayanıyor ve Metin Tabanlı Gömme Modelleri için Devrimsel Yenilikler (MTEB) sıralamasında kendi boyutundaki açık kaynaklı modeller arasında en üst sıralarda yer alıyor. Bu model, mobil öncelikli yapay zeka uygulamalarında temel taşı olacak yeni teknikler sunuyor.
EmbeddingGemma, "elastic inference" olarak adlandırılan ve geliştiricilerin tam model veya daha hızlı ancak tam işlevsel alt modeli seçmesine olanak tanıyan yeni yaklaşımlar kullanıyor. Gelecekte, mevcut göreve ve cihaz yüküne bağlı olarak tam model ve alt model arasında dinamik geçiş yapmayı mümkün kılan "elastic inference" tam desteği sunacak. Ayrıca, "KV cache sharing" gibi çıkarım sürecini hızlandıran yeni bir özellik sayesinde, özellikle akışlı yanıtlar sunan uygulamalar için kritik bir metrik olan "ilk token'a kadar geçen süreyi" önemli ölçüde azaltıyor.
Bu gelişmiş model, 768'den 128'e kadar özelleştirilebilir çıktı boyutları (Matryoshka temsiliyet öğrenmesi sayesinde) ve 2K token bağlam penceresi ile mobil telefonlar, dizüstü bilgisayarlar ve masaüstü bilgisayarlar gibi her türlü cihazda çalışmak üzere optimize edilmiştir. EmbeddingGemma, özellikle Gelişmiş Mobil Yapay Zeka Çıkarımı için Gemma 3n ile birlikte kullanıldığında, mobil RAG (Retrieval Augmented Generation) işlem hatları, anlamsal arama ve daha fazlası için yeni kullanım alanlarının kapısını aralıyor.
Google, EmbeddingGemma'nın geliştiriciler için kolayca erişilebilir olmasını sağlamak amacıyla sentence-transformers, llama.cpp, MLX, Ollama ve LMStudio gibi popüler araçlarla entegrasyonunu destekliyor. Bu yaygın destek sayesinde geliştiriciler, bu güçlü modeli projelerine hızlıca entegre edebilir ve gizlilik odaklı, esnek on-device yapay zeka uygulamaları geliştirebilirler. Google ayrıca, kullanıcıların hassas verilerinin güvende kalmasını sağlayarak, bu modelle kişisel dosyalarda, metinlerde, e-postalarda ve bildirimlerde çevrimdışı arama yapma gibi yeni yeteneklerin kilidini açıyor.