GPU-дан жылдамырақ: Cerebras рекордтық жылдамдықтағы Kimi K2.6 моделін іске қосты

2026 жылғы ең ірі технологиялық IPO-дан кейін, Калифорнияның Cerebras Systems компаниясы жасанды интеллект инференсі нарығында көшбасшылық үшін батыл қадам жасады. Чип өндірушісі корпоративтік клиенттер үшін Бейжіңнің Moonshot AI компаниясы әзірлеген, бір триллион параметрі бар Kimi K2.6 ашық моделін ұсынды. Cerebras жабдықтарында бұл нейрожелінің жылдамдығы секундына шамамен 1000 токенге жетті, бұл қолданыстағы GPU базасындағы кез келген шешім үшін қолжетімсіз нәтиже. Бұл туралы Ixbt.com хабарлайды.
Artificial Analysis зерттеу фирмасы жүргізген тәуелсіз аудит секундына 981 токен нәтижесін тіркеді. Бұл Cerebras платформасының ең жақын GPU бұлтты провайдерінен 6,7 есе, ал нарықтың орташа көрсеткішінен 23 есе жылдам екенін көрсетті. Тәжірибеде 10 000 токеннен тұратын код жазу сұранысы Cerebras жүйесінде небәрі 5,6 секунд алды, ал Kimi-дің ресми бұлтты сервисі мұны 163,7 секундта орындаған еді.
Kimi K2.6 моделі Mixture-of-Experts (MoE) архитектурасына негізделген, ондағы 1 триллион параметрдің 32 миллиарды әр өту кезінде іске қосылады. Модель беделді SWE-Bench Pro бенчмаркінде 58,6 ұпаймен Claude Opus 4.6-дан озып, GPT-5.4-пен теңесті. Компаниялар үшін бұл ашық алгоритм Anthropic пен OpenAI-дің қымбат жабық API-леріне қарағанда үнемді және тиімді баламаға айналуда.
Cerebras-тың мұндай феноменалды жылдамдығы оның бірегей аппараттық тәсіліне байланысты. Дәстүрлі инференс ондаған жеке GPU-да жұмыс істесе, Cerebras Wafer-Scale Engine 3 процессоры тұтас чип болып табылады. Ол 44 гигабайт өте жылдам SRAM жадын қамтиды және кристалл ішіндегі желі өткізу қабілеті бәсекелестердің NVLink интерфейсінен 200 есе жоғары. Қазіргі уақытта жаңалық тек Fortune 500 тізіміндегі ірі корпорациялар үшін жабық бұлтты қызмет ретінде ұсынылуда.
“Zamin”-ді Telegram-нан оқыңыз!