NVIDIA и AMD не обязательны: DeepSeek В4 обучили на чипах Huawei

DeepSeek В4 использует чипы Huawei для выполнения задач искусственного интеллекта. Согласно последнему исследованию компании, для этапа пост-обучения модели В4 Pro применялись процессоры Huawei Аскенд. Это важный шаг для полупроводниковой промышленности Китая, поскольку местные производители, добившись успеха в обработке данных, ранее сталкивались с трудностями в таких сложных задачах, как обучение моделей. Об этом сообщает Иксбт.ком сообщает .
Группа исследователей использовала вычислительный кластер из примерно 1000 чипов Huawei Аскенд 910К для обучения модели DeepSeek В4 Pro. В реализации проекта помимо Huawei участвовали ряд престижных институтов Шэньчжэня. Это процесс полнопараметрического обучения, в ходе которого возможности модели были полностью обновлены без изменения её архитектуры.
В сфере искусственного интеллекта инференс (вывод) и пост-обучение являются двумя разными сегментами. Первый — это запуск готовой модели для ответа на запросы пользователей, второй — обучение модели правильному выполнению команд человека. Этап пост-обучения обеспечивает соблюдение моделью правил безопасности и работу в соответствии с точными инструкциями. Эти шаги помогают китайской индустрии ИИ достичь независимости.
Ранее модели DeepSeek обучались на чипах NVIDIA или AMD. Например, модель DeepSeek В3 была подготовлена на кластере из 2048 чипов NVIDIA Х800. В настоящее время стартап DeepSeek готовится привлечь инвестиции в размере 50 млрд юаней (около 7,4 млрд долларов). DeepSeek, являющийся конкурентом таких моделей, как ChatGPT, демонстрирует высокую эффективность в генерации текста, написании кода и решении логических задач.


















Комментарии 0
…