Alibaba представила искусственный интеллект Qwen3.7-Max

Alibaba представила флагманскую модель Qwen3.7-Max из серии Qwen, предназначенную для выполнения длительных агентских задач. В ходе демонстрации модель самостоятельно совершила 1 158 вызовов инструментов за 34,7 часа, а использование SGLang Triton Kernel, компонента популярной библиотеки для инференса больших моделей, ускорило работу в десять раз. Для сравнения, другие модели, такие как DeepSeek V4 Pro и Kimi K2.6, достигли ускорения в 3,3x и 5x соответственно. Об этом сообщает Habr.com сообщает .
Qwen3.7-Max обучалась в более чем 8 200 различных средах, что позволяет ей планировать многоэтапные задачи, вызывать инструменты и реагировать на их результаты. По данным Alibaba, увеличение количества сред почти линейно улучшило средний рейтинг модели в восьми агентских бенчмарках, подняв её с 9-го места в базовой версии до 3-го в финальной.
В 12 выбранных публичных бенчмарках Qwen3.7-Max лидирует почти во всех категориях. Например, в Terminal-Bench 2.0 она набрала 69,7 балла против 65,4 балла у Claude Opus 4.6 Max Thinking. Однако она немного отстает в задачах по написанию длинного кода в бенчмарке NL2Repo, где Claude опережает её на 0,4 балла. Примечательно, что некоторые новые версии конкурентов не были включены в сравнения.
Qwen3.7-Max доступна бесплатно через чат-бот компании и по API по цене $2,5 за 1 миллион входных токенов и $7,5 за 1 миллион выходных токенов. Однако открытые веса, в отличие от предыдущих версий Max, не анонсируются.
Читайте «Zamin» в Telegram!