NVIDIA ва AMD шарт эмас: DeepSeek В4 Huawei чипларида ўқитилди

NVIDIA ва AMD шарт эмас: DeepSeek В4 Huawei чипларида ўқитилди

DeepSeek В4 сунъий интеллект вазифаларини бажаришда Huawei чипларидан фойдаланмоқда. Компаниянинг сўнгги тадқиқотига кўра, В4 Pro моделини пост-тренинг (ўқитишдан кейинги жараён) босқичидан ўтказиш учун Huawei Ассенд процессорлари қўлланилган. Бу Хитойнинг яримўтказгичлар саноати учун навбатдаги муҳим ютуқ ҳисобланади, чунки маҳаллий ишлаб чиқарувчилар маълумотларни қайта ишлашда муваффақиятга эришган бўлса-да, моделларни ўқитиш каби мураккаб вазифаларда қийинчиликларга дуч келаётган эди. Бу ҳақда Ixbt.com хабар беради.

Тадқиқотчилар гуруҳи DeepSeek В4 Pro моделини ўқитиш учун тахминан 1000 та Huawei Ассенд 910К чипидан иборат ҳисоблаш кластеридан фойдаланган. Лойиҳани амалга оширишда Huawei билан бирга Шенжен шаҳридаги бир қатор нуфузли институтлар ҳамкорлик қилди. Бу тўлиқ параметрли ўқитиш жараёни бўлиб, унда моделнинг тузилиши ўзгартирилмаган ҳолда унинг имкониятлари бутунлай янгиланди.

Сунъий интеллект соҳасида хулоса чиқариш (инференсе) ва пост-тренинг икки хил сегмент ҳисобланади. Биринчиси тайёр моделни фойдаланувчи сўровларига жавоб бериш учун ишга тушириш бўлса, иккинчиси моделни инсон буйруқларини тўғри бажаришга ўргатишдир. Пост-тренинг босқичи моделнинг хавфсизлик қоидаларига риоя қилиши ва аниқ кўрсатмалар асосида ишлашини таъминлайди. Бу қадамлар Хитойнинг сунъий интеллект саноатида мустақилликка эришишига ёрдам беради.

Илгари DeepSeek моделлари NVIDIA ёки AMD чипларида ўқитилар эди. Масалан, DeepSeek В3 модели 2048 та NVIDIA Ҳ800 чипидан иборат кластерда тайёрланган. Ҳозирда DeepSeek стартапи 50 миллиард юан (тахминан 7,4 миллиард доллар) миқдорида инвестиция жалб қилишга тайёрланмоқда. ChatGPT каби моделларга рақобатчи бўлган DeepSeek матн яратиш, код ёзиш ва мантиқий масалаларни ечишда юқори самарадорлик кўрсатмоқда.

Zamin.uz сайтини Google'га қўшинг"Zamin"ни Telegram'да ўқинг!
Abror Shuhratov
«ZAMIN.UZ» муҳаррири

Изоҳлар 0

Мавзуга оид янгиликлар