Alibaba Qwen3.7-Max sun'iy intellektni namoyish qildi

Alibaba Qwen seriyasidagi eng so'nggi Qwen3.7-Max flagmanini taqdim etdi, u uzoq agent vazifalarini bajarish uchun mo'ljallangan. Namoyish davomida model 34,7 soatda 1 158 ta vosita chaqiruvini mustaqil ravishda amalga oshirdi va SGLang Triton Kernel GPU yadrosi, katta model inferensiyasi uchun mashhur ochiq manba kutubxonasining komponenti, o'n baravar tezlashtirildi. Taqqoslash uchun, boshqa modellar, masalan, DeepSeek V4 Pro va Kimi K2.6 mos ravishda 3,3x va 5x tezlikni oshirishga erishdi. Bu haqda Habr.com xabar beradi.
Qwen3.7-Max 8 200 dan ortiq turli muhitlarda o'qitilgan bo'lib, u ko'p bosqichli vazifalarni rejalashtirish, vositalarni chaqirish va ularning natijalariga javob berish imkonini beradi. Alibaba ma'lumotlariga ko'ra, muhitlarning ko'payishi modelning sakkizta agent benchmarklaridagi o'rtacha reytingini deyarli chiziqli ravishda yaxshilagan, asosiy versiyada 9-o'rindan yakuniy versiyada 3-o'ringa ko'tarilgan.
12 ta tanlangan ommaviy benchmarklarda Qwen3.7-Max deyarli barcha toifalarda yetakchilik qiladi. Masalan, Terminal-Bench 2.0 da u Claude Opus 4.6 Max Thinkingning 65,4 balliga nisbatan 69,7 ball to'pladi. Biroq, u uzoq kodlash vazifalari uchun NL2Repo benchmarkida biroz ortda qoladi, bu yerda Claude uni 0,4 ballga ortda qoldiradi. E'tiborlisi, ba'zi yangi raqobatchi versiyalar taqqoslashlarga kiritilmagan.
Qwen3.7-Max kompaniyaning chatboti va API orqali bepul mavjud bo'lib, 1 million kirish tokenlari uchun $2,5 va 1 million chiqish tokenlari uchun $7,5 narxda taqdim etiladi. Biroq, ochiq vaznlar avvalgi Max versiyalari bilan mos ravishda e'lon qilinmaydi.
“Zamin”ni Telegramʻda oʻqing!