NVIDIA et AMD non requis : DeepSeek V4 entraîné sur des puces Huawei

DeepSeek V4 utilise des puces Huawei pour effectuer des tâches d'intelligence artificielle. Selon les dernières recherches de l'entreprise, des processeurs Huawei Ascend ont été utilisés pour l'étape de post-entraînement du modèle V4 Pro. Il s'agit d'une nouvelle réussite majeure pour l'industrie des semi-conducteurs en Chine, car les fabricants locaux avaient réussi dans le traitement des données mais rencontraient des difficultés dans des tâches complexes comme l'entraînement des modèles. Rapporté par Ixbt.com rapport .
Un groupe de chercheurs a utilisé un cluster de calcul composé d'environ 1 000 puces Huawei Ascend 910C pour entraîner le modèle DeepSeek V4 Pro. Plusieurs instituts prestigieux de Shenzhen ont collaboré avec Huawei pour mettre en œuvre le projet. Il s'agissait d'un processus d'entraînement complet des paramètres, où les capacités du modèle ont été entièrement mises à jour sans modifier son architecture.
Dans le domaine de l'intelligence artificielle, l'inférence et le post-entraînement sont deux segments distincts. Le premier consiste à exécuter un modèle prêt à l'emploi pour répondre aux requêtes des utilisateurs, tandis que le second consiste à apprendre au modèle à exécuter correctement les commandes humaines. L'étape de post-entraînement garantit que le modèle respecte les règles de sécurité et fonctionne sur la base d'instructions précises. Ces étapes aident l'industrie chinoise de l'IA à atteindre l'indépendance.
Auparavant, les modèles DeepSeek étaient entraînés sur des puces NVIDIA ou AMD. Par exemple, le modèle DeepSeek V3 a été préparé sur un cluster de 2 048 puces NVIDIA H800. Actuellement, la start-up DeepSeek se prépare à attirer des investissements d'un montant de 50 milliards de yuans (environ 7,4 milliards de dollars). En concurrence avec des modèles comme ChatGPT, DeepSeek fait preuve d'une grande efficacité dans la génération de texte, la programmation et la résolution de problèmes logiques.














Commentaires 0
…