NVIDIA ve AMD şart değil: DeepSeek V4, Huawei çiplerinde eğitildi

NVIDIA ve AMD şart değil: DeepSeek V4, Huawei çiplerinde eğitildi

DeepSeek V4, yapay zeka görevlerini yerine getirmek için Huawei çiplerini kullanıyor. Şirketin son araştırmasına göre, V4 Pro modelinin post-eğitim (eğitim sonrası süreç) aşamasından geçirmek için Huawei Ascend işlemcileri kullanıldı. Bu, yerel üreticiler veri işlemede başarı elde etse de model eğitimi gibi karmaşık görevlerde zorluklarla karşılaşıyordu; bu nedenle Çin'in yarı iletken endüstrisi için bir sonraki önemli başarı olarak kabul ediliyor. Ixbt.com haber veriyor.

Araştırmacılar grubu, DeepSeek V4 Pro modelini eğitmek için yaklaşık 1000 adet Huawei Ascend 910C çipinden oluşan bir hesaplama kümesi kullandı. Projenin uygulanmasında Huawei ile birlikte Shenzhen'deki bir dizi prestijli enstitü işbirliği yaptı. Bu, modelin mimarisi değiştirilmeden yeteneklerinin tamamen güncellendiği tam parametreli bir eğitim süreciydi.

Yapay zeka alanında çıkarım (inference) ve post-eğitim iki farklı segmenttir. İlki, hazır modeli kullanıcı sorgularına yanıt vermek için çalıştırmaktır; ikincisi ise modeli insan komutlarını doğru şekilde yerine getirmeye öğretmektir. Post-eğitim aşaması, modelin güvenlik kurallarına uymasını ve kesin talimatlar doğrultusunda çalışmasını sağlar. Bu adımlar, Çin'in yapay zeka endüstrisinin bağımsızlığa ulaşmasına yardımcı olur.

Daha önce DeepSeek modelleri NVIDIA veya AMD çiplerinde eğitiliyordu. Örneğin, DeepSeek V3 modeli 2048 adet NVIDIA H800 çipinden oluşan bir kümede hazırlandı. Şu anda DeepSeek girişimi 50 milyar yuan (yaklaşık 7,4 milyar dolar) tutarında yatırım çekmeye hazırlanıyor. ChatGPT gibi modellere rakip olan DeepSeek, metin oluşturma, kod yazma ve mantıksal sorunları çözmede yüksek verimlilik gösteriyor.

Zamin.uz'u Google'a ekleyin"Zamin"i Telegram'da okuyun!
Abror Shuhratov
«ZAMIN.UZ» editör

Yorumlar 0

İlgili haberler