Alibaba Qwen3.7-Max жасанды интеллектін таныстырды

Alibaba ұзақ агенттік тапсырмаларды орындауға арналған Qwen сериясындағы ең жаңа Qwen3.7-Max флагманын таныстырды. Демонстрация барысында модель 34,7 сағатта 1 158 құрал шақыруын дербес орындады және үлкен модельдерді инференс жасауға арналған танымал ашық бастапқы кітапхананың компоненті SGLang Triton Kernel арқылы он есе жылдамдатылды. Салыстыру үшін, DeepSeek V4 Pro және Kimi K2.6 сияқты басқа модельдер сәйкесінше 3,3x және 5x жылдамдыққа қол жеткізді. Бұл туралы Habr.com хабарлайды .
Qwen3.7-Max 8 200-ден астам әртүрлі ортада оқытылған, бұл оған көп сатылы тапсырмаларды жоспарлауға, құралдарды шақыруға және олардың нәтижелеріне жауап беруге мүмкіндік береді. Alibaba мәліметтері бойынша, орталардың көбеюі модельдің сегіз агенттік бенчмарктегі орташа рейтингін дерлік сызықты түрде жақсартып, базалық нұсқадағы 9-орыннан соңғы нұсқада 3-орынға көтерді.
Таңдалған 12 қоғамдық бенчмаркте Qwen3.7-Max барлық дерлік санаттарда көш бастап тұр. Мысалы, Terminal-Bench 2.0-де ол Claude Opus 4.6 Max Thinking-тің 65,4 ұпайына қарсы 69,7 ұпай жинады. Алайда, ол ұзақ кодтау тапсырмаларына арналған NL2Repo бенчмаркінде сәл артта қалады, мұнда Claude оны 0,4 ұпайға озып кетті. Айта кетерлігі, кейбір жаңа бәсекелес нұсқалар салыстыруларға енгізілмеген.
Qwen3.7-Max компанияның чат-боты және API арқылы қолжетімді, 1 миллион кіріс токені үшін $2,5 және 1 миллион шығыс токені үшін $7,5 бағасымен ұсынылады. Алайда, алдыңғы Max нұсқаларынан айырмашылығы, ашық салмақтар жарияланбайды.
“Zamin”-ді Telegram-нан оқыңыз!