Быстрее GPU: Cerebras запустила модель Kimi K2.6 с рекордной скоростью

После крупнейшего технологического IPO 2026 года калифорнийская компания Cerebras Systems сделала смелый шаг к лидерству на рынке инференса искусственного интеллекта. Чипмейкер представил для корпоративных клиентов открытую модель Kimi K2.6 с одним триллионом параметров, разработанную пекинской компанией Moonshot AI. Скорость работы этой нейросети на оборудовании Cerebras достигла почти 1000 токенов в секунду, что является недостижимым результатом для любого решения на базе GPU. Об этом Ixbt.com сообщает.
Независимый аудит, проведенный исследовательской фирмой Artificial Analysis, зафиксировал результат 981 токен в секунду. Это показало, что платформа Cerebras в 6,7 раза быстрее ближайшего облачного GPU-провайдера и в 23 раза быстрее среднего рыночного показателя. На практике запрос на написание кода из 10 000 токенов занял в системе Cerebras всего 5,6 секунды, тогда как официальный облачный сервис Kimi выполнил его за 163,7 секунды.
Модель Kimi K2.6 основана на архитектуре Mixture-of-Experts (MoE), где из 1 триллиона параметров при каждом проходе активируются 32 миллиарда. В престижном бенчмарке SWE-Bench Pro модель набрала 58,6 балла, обойдя Claude Opus 4.6 и сравнявшись с GPT-5.4. Для компаний этот открытый алгоритм становится экономичной и эффективной альтернативой дорогим закрытым API от Anthropic и OpenAI.
Феноменальная скорость Cerebras обусловлена уникальным аппаратным подходом. В то время как традиционный инференс работает на десятках отдельных GPU, процессор Cerebras Wafer-Scale Engine 3 является монолитным чипом. Он содержит 44 ГБ сверхбыстрой памяти SRAM, а пропускная способность сети внутри кристалла в 200 раз выше интерфейса NVLink конкурентов. В настоящее время новинка предлагается только как закрытый облачный сервис для крупных корпораций из списка Fortune 500.
Читайте «Zamin» в Telegram!