DeepSeek 1,6 trilyon parametreli V4 modelini tanıttı

Çinli DeepSeek laboratuvarı, en yeni büyük dil modelleri olan DeepSeek V4 Flash ve V4 Pro versiyonlarını duyurdu. Bu modeller, geçen yılki V3.2 ve popüler R1 modellerinin devamı niteliğinde olup, mimari açıdan önemli ölçüde geliştirilmiştir. Her iki model de 1 milyon tokene kadar bağlam penceresini destekleyerek kullanıcıların çok büyük hacimli belgeler ve kodlarla çalışmasına olanak tanıyor. Techcrunch.com bu konuda haber veriyor.
V4 Pro modeli toplam 1,6 trilyon parametreye sahip olup, şu anda dünyanın en büyük açık ağırlıklı modeli haline geldi. Karşılaştırma yapmak gerekirse, Moonshot AI şirketinin Kimi K 2.6 (1,1 trilyon) ve DeepSeek V3.2 (671 milyar) modellerini geride bırakmış durumda. Daha küçük olan V4 Flash modeli ise 284 milyar parametreye sahip. Şirket temsilcileri, yeni sistemlerin mantıksal akıl yürütme testlerinde mevcut lider açık ve kapalı modellerle aradaki farkı neredeyse kapattığını belirtti.

DeepSeek verilerine göre, V4-Pro-Max modeli mantıksal görevlerde OpenAI şirketinin GPT-5.2 ve Google'ın Gemini 3.0 Pro sistemlerinden üstün geliyor. Programlama yarışmalarında ise her iki yeni model GPT-5.4 ile eşit sonuçlar gösterdi. Ancak, bilgi düzeyini ölçen testlerde Çin modellerinin hala ABD'nin en gelişmiş sistemlerinden 3 ila 6 ay geride kaldığı kaydedildi.
Yeni modeller fiyat açısından piyasadaki rakiplerinden çok daha ucuz. Örneğin, V4 Flash modeli 1 milyon giriş tokeni için 0,14 ABD doları talep ediyor; bu rakam GPT-5.4 Nano ve Gemini 3.1 Flash fiyatlarından daha düşüktür. Bu tanıtımın, ABD tarafından Çin'e yönelik fikri mülkiyet hırsızlığı suçlamalarının dile getirildiği ve DeepSeek şirketinin Anthropic ile OpenAI modellerini kopyalamakla suçlandığı bir dönemde gerçekleşmesi dikkat çekicidir.
“Zamin”i Telegram'da okuyun!