Alibaba dévoile l'intelligence artificielle Qwen3.7-Max

Alibaba a présenté son dernier fleuron, Qwen3.7-Max, conçu pour les tâches d'agent de longue durée. Lors de la démonstration, le modèle a effectué de manière autonome 1 158 appels d'outils en 34,7 heures, et le SGLang Triton Kernel, un composant de la bibliothèque open-source populaire pour l'inférence de grands modèles, a été accéléré par dix. À titre de comparaison, d'autres modèles comme DeepSeek V4 Pro et Kimi K2.6 ont atteint des augmentations de vitesse de 3,3x et 5x respectivement. C'est ce que rapporte Habr.com .
Qwen3.7-Max a été entraîné dans plus de 8 200 environnements différents, ce qui lui permet de planifier des tâches en plusieurs étapes, d'appeler des outils et de répondre à leurs résultats. Selon Alibaba, l'augmentation du nombre d'environnements a amélioré le classement moyen du modèle dans huit benchmarks d'agents de manière presque linéaire, passant de la 9e place dans la version de base à la 3e place dans la version finale.
Dans 12 benchmarks publics sélectionnés, Qwen3.7-Max est en tête dans presque toutes les catégories. Par exemple, dans Terminal-Bench 2.0, il a obtenu 69,7 points contre 65,4 points pour Claude Opus 4.6 Max Thinking. Cependant, il est légèrement en retrait pour les tâches de codage longues sur le benchmark NL2Repo, où Claude le devance de 0,4 point. Il est à noter que certaines nouvelles versions concurrentes n'ont pas été incluses dans les comparaisons.
Qwen3.7-Max est disponible gratuitement via le chatbot de l'entreprise et l'API, au prix de 2,5 $ pour 1 million de jetons d'entrée et 7,5 $ pour 1 million de jetons de sortie. Cependant, les poids ouverts ne sont pas annoncés comme pour les versions Max précédentes.
Lisez “Zamin” sur Telegram !