date

Schneller als GPUs: Cerebras startet rekordverdächtiges Kimi K2.6-Modell

Schneller als GPUs: Cerebras startet rekordverdächtiges Kimi K2.6-Modell

Nach dem größten Tech-IPO des Jahres 2026 hat das kalifornische Unternehmen Cerebras Systems einen mutigen Schritt zur Marktführerschaft bei der KI-Inferenz gemacht. Der Chiphersteller präsentierte das offene Modell Kimi K2.6 mit einer Billion Parametern, das vom Pekinger Unternehmen Moonshot AI entwickelt wurde, für Unternehmenskunden. Auf Cerebras-Hardware erreichte dieses neuronale Netzwerk Geschwindigkeiten von fast 1000 Tokens pro Sekunde – ein Ergebnis, das für jede GPU-basierte Lösung unerreichbar ist. Dies berichtet Ixbt.com berichtet .

Eine unabhängige Prüfung durch das Forschungsunternehmen Artificial Analysis ergab einen Wert von 981 Tokens pro Sekunde. Damit ist die Cerebras-Plattform 6,7-mal schneller als der nächstgelegene GPU-Cloud-Anbieter und 23-mal schneller als der Marktdurchschnitt. In der Praxis dauerte eine Anfrage zum Schreiben von Code mit 10.000 Tokens auf dem Cerebras-System nur 5,6 Sekunden, während der offizielle Kimi-Cloud-Dienst dafür 163,7 Sekunden benötigte.

Das Kimi K2.6-Modell basiert auf einer Mixture-of-Experts (MoE)-Architektur, bei der 32 Milliarden der insgesamt 1 Billion Parameter pro Durchlauf aktiviert werden. Im renommierten SWE-Bench Pro Benchmark erzielte das Modell 58,6 Punkte, übertraf damit Claude Opus 4.6 und zog mit GPT-5.4 gleich. Für Unternehmen wird dieser offene Algorithmus zu einer kosteneffizienten Alternative zu den teuren geschlossenen APIs von Anthropic und OpenAI.

Die phänomenale Geschwindigkeit von Cerebras ist auf den einzigartigen Hardware-Ansatz zurückzuführen. Während herkömmliche Inferenz auf Dutzenden separaten GPUs läuft, ist der Cerebras Wafer-Scale Engine 3-Prozessor ein monolithischer Chip. Er enthält 44 Gigabyte ultraschnellen SRAM-Speicher, und die Bandbreite des On-Chip-Netzwerks ist 200-mal höher als bei den NVLink-Schnittstellen der Konkurrenz. Derzeit wird die Neuerung nur als privater Cloud-Dienst für große Fortune-500-Konzerne angeboten.

Ctrl
Enter
Fehler gefunden?
Markieren Sie den Text und drücken Sie Strg+Enter
Information
Benutzer der Gruppe Gast dürfen diese Veröffentlichung nicht kommentieren.
Nachrichten » Technologie » Schneller als GPUs: Cerebras startet rekordverdächtiges Kimi K2.6-Modell