date

Plus rapide que les GPU : Cerebras lance le modèle Kimi K2.6 à une vitesse record

Plus rapide que les GPU : Cerebras lance le modèle Kimi K2.6 à une vitesse record

Suite à la plus grande introduction en bourse technologique de 2026, la société californienne Cerebras Systems a franchi une étape audacieuse vers le leadership sur le marché de l'inférence IA. Le fabricant de puces a présenté le modèle ouvert Kimi K2.6, doté d'un billion de paramètres et développé par la société pékinoise Moonshot AI, destiné aux entreprises clientes. Sur le matériel Cerebras, ce réseau neuronal a atteint des vitesses de près de 1000 jetons par seconde, un résultat inatteignable pour toute solution basée sur GPU existante. C'est ce que rapporte Ixbt.com rapporte .

Un audit indépendant réalisé par la société de recherche Artificial Analysis a enregistré un résultat de 981 jetons par seconde. Cela a montré que la plateforme Cerebras est 6,7 fois plus rapide que le fournisseur de cloud GPU le plus proche et 23 fois plus rapide que la moyenne du marché. En pratique, une requête pour écrire du code composé de 10 000 jetons n'a pris que 5,6 secondes sur le système Cerebras, alors que le service cloud officiel de Kimi a mis 163,7 secondes.

Le modèle Kimi K2.6 est basé sur une architecture Mixture-of-Experts (MoE), où 32 milliards de ses 1 billion de paramètres sont activés à chaque passage. Sur le prestigieux benchmark SWE-Bench Pro, le modèle a obtenu 58,6 points, dépassant Claude Opus 4.6 et égalant GPT-5.4. Pour les entreprises, cet algorithme ouvert devient une alternative rentable et efficace aux API fermées coûteuses d'Anthropic et d'OpenAI.

La vitesse phénoménale de Cerebras est due à son approche matérielle unique. Alors que l'inférence traditionnelle fonctionne sur des dizaines de GPU distincts, le processeur Cerebras Wafer-Scale Engine 3 est une puce monolithique. Il contient 44 gigaoctets de mémoire SRAM ultra-rapide, et la bande passante du réseau sur puce est 200 fois supérieure aux interfaces NVLink des concurrents. Actuellement, cette innovation n'est proposée que sous forme de service cloud privé pour les grandes entreprises du Fortune 500.

Ctrl
Enter
Vous avez trouvé une erreur ?
Sélectionnez la phrase et appuyez sur Ctrl+Entrée
Informations
Les utilisateurs du groupe Invité ne sont pas autorisés à commenter cette publication.
Actualités » Technologie » Plus rapide que les GPU : Cerebras lance le modèle Kimi K2.6 à une vitesse record