Alibaba Qwen3.7-Plus : Tout savoir sur le nouveau LLM multimodal

Le géant technologique chinois Alibaba accélère la cadence à un rythme effréné. Quatorze jours seulement après avoir dévoilé sa déclinaison Max, la firme lance officiellement Qwen3.7-Plus. Ce nouveau modèle multimodal unifié fusionne la vision et le langage au sein d’un agent unique capable de comprendre, de raisonner et d’agir sur des environnements graphiques complexes. Une offensive technologique majeure qui a immédiatement fait bondir le titre d’Alibaba en bourse de plus de 6 %.

Les points clé à retenir

Unification native du traitement visuel et textuel au sein d’un agent d’interface unique.
Cadence d’itération ultra-rapide, le modèle Plus sortant seulement deux semaines après Qwen3.7-Max.
Excellente performance aux benchmarks, propulsant Alibaba au 5e rang mondial des laboratoires en vision sur LM Arena.
Disponibilité immédiate via l’API d’Alibaba Cloud avec une compatibilité totale OpenAI et Anthropic.
Réaction boursière immédiate avec une hausse de 6,6 % de l’action à la clôture de Hong Kong.

Une cadence infernale : Qwen3.7-Plus succède à la version Max

Le marché mondial de l’intelligence artificielle assiste à une démonstration de force d’Alibaba Cloud. En déployant officiellement son nouveau modèle phare, Qwen3.7-Plus, l’entreprise chinoise confirme sa stratégie d’omniprésence. Cette mise à jour intervient seulement deux semaines après la présentation de Qwen3.7-Max lors de l’Alibaba Cloud Summit.

Cette vitesse d’exécution témoigne de l’ambition d’Alibaba, soutenue par un plan d’investissement massif de 50 milliards de dollars dédié à l’expansion de ses centres de données mondiaux et au développement de grands modèles de langage (LLM). Disponible via l’API de la plateforme Model Studio d’Alibaba Cloud, Qwen3.7-Plus s’intègre facilement dans les écosystèmes existants grâce à des points de terminaison (endpoints) compatibles avec les standards d’OpenAI et d’Anthropic.

Qwen3.7-Plus vs Qwen3.7-Max : Deux visions de l’IA agentique

Bien que partageant la même architecture de base, les déclinaisons Plus et Max répondent à des philosophies architecturales et opérationnelles distinctes.

Qwen3.7-Plus : L’expert de l’interaction visuelle et des interfaces (GUI/CLI)

Le modèle Plus a été spécifiquement entraîné pour agir comme un agent interactif multimodal unifié. Son cœur de compétence réside dans sa capacité à fusionner la perception visuelle et la logique textuelle. Concrètement, l’équipe de développement de Qwen le définit comme un système capable d’opérer de manière fluide sur des tâches visuelles et textuelles à travers les interfaces graphiques (GUI) et les lignes de commande (CLI). C’est l’outil idéal pour la recherche augmentée (RAG), l’analyse de documents complexes mêlant graphiques et textes, et l’assistance à la productivité en temps réel.

Qwen3.7-Max : Le mastodonte du code et de l’exécution autonome

À l’inverse, Qwen3.7-Max est optimisé pour les flux de travail textuels lourds et complexes. Il se spécialise dans l’exécution autonome sur de longs horizons temporels (long-horizon autonomous execution) et s’impose comme un moteur de génération de code hautement performant. Là où le Plus brille par son agilité visuelle et son interaction avec l’utilisateur, le Max se distingue par sa puissance de calcul logique et sa capacité à automatiser des scripts complexes en arrière-plan.

Benchmarks : Alibaba s’impose au sommet des laboratoires chinois

Avant même leur déploiement officiel, les versions « Preview » de la famille Qwen3.7 ont bousculé les classements de référence de la plateforme LM Arena (LMSYS), révélant une solide spécialisation :

Qwen3.7-Plus-Preview s’est hissé à la 16e place mondiale en capacités visuelles, ce qui permet à Alibaba de se positionner comme le 5e meilleur laboratoire mondial en vision par ordinateur.
Qwen3.7-Max-Preview s’est quant à lui adjugé la 13e place mondiale en capacités textuelles.

Selon les rapports sectoriels, notamment du South China Morning Post, ces scores font de la gamme Qwen3.7 les modèles d’IA développés en Chine les plus performants du marché. Bien qu’ils restent encore légèrement en retrait derrière les modèles frontières américains conçus par Anthropic, Google et OpenAI, l’écart se resserre à une vitesse spectaculaire.

L’Avis de la rédac :

Bien que les deux modèles partagent la même architecture de base de la série Qwen3.7 d’Alibaba et soient itérés à un rythme très rapide (à peine deux semaines d’intervalle en mai et juin 2026), ils ont été optimisés pour des cas d’usage et des types de tâches radicalement différents.

1. Objectif principal et positionnement

Qwen3.7-Plus : Un agent interactif multimodal unifié
Le modèle Plus est conçu pour fusionner nativement le traitement visuel et textuel au sein d’un agent unique. Son but est d’agir comme une interface capable de comprendre, de raisonner et d’agir sur des environnements graphiques et textuels. L’équipe Qwen le décrit d’ailleurs comme un système offrant une opération unifiée GUI (interface graphique) et CLI (interface en ligne de commande).
Qwen3.7-Max : Un moteur d’exécution autonome à long terme
Le modèle Max est le poids lourd de la gamme pour les flux de travail complexes et étendus. Il cible explicitement l’exécution autonome sur des horizons temporels longs (« long-horizon autonomous execution ») et se spécialise fortement dans le développement et le codage avancé.

2. Capacités techniques et cas d’usage

Le tableau ci-dessous permet de visualiser la répartition de leurs spécialisations :

Caractéristique / Spécialisation	Qwen3.7-Plus	Qwen3.7-Max
Multimodalité (Vision + Texte)	Native et centrale (Perception, raisonnement visuel, ancrage/grounding).	Présente, mais le focus est mis sur la logique et le texte complexe.
Type d’interaction	Assistant de productivité, agent visuel, recherche augmentée (RAG).	Agent de codage lourd, automatisation de flux de travail complexes.
Type d’interface cible	Navigation et manipulation d’interfaces (GUI & CLI).	Systèmes de scripts, environnements de développement, exécution autonome.

3. Performances et classements (Benchmarks LMSYS Arena)

Avant leur lancement officiel, les versions « Preview » des deux modèles ont été testées sur la plateforme LM Arena, révélant des forces distinctes :

Qwen3.7-Plus-Preview s’est illustré dans le domaine de la vision, se classant 16e mondial. Cela a permis à Alibaba de se hisser au 5e rang mondial des laboratoires en IA sur les capacités visuelles.
Qwen3.7-Max-Preview s’est quant à lui imposé sur les capacités textuelles, se positionnant à la 13e place mondiale.

Note sur le marché : Bien que ces scores fassent de la gamme Qwen3.7 les modèles d’IA chinois les plus performants du marché à ce jour, les données de référence indiquent qu’ils restent légèrement en retrait derrière les modèles frontières américains développés par Anthropic, Google et OpenAI.

En résumé

Choisis Qwen3.7-Plus si tu as besoin d’un agent polyvalent capable de « voir » et d’interagir avec des interfaces, de lier du texte à des images, et de servir d’assistant de productivité visuelle au quotidien.
Choisis Qwen3.7-Max si ton besoin se concentre sur le développement informatique, la génération de code lourd, ou la planification autonome de tâches complexes nécessitant un raisonnement textuel poussé sur la durée.

Liste à puces des points clés

Modèle unifié : Qwen3.7-Plus fusionne nativement le texte et l’analyse d’images.
Cible GUI & CLI : Conçu spécifiquement pour interagir avec les interfaces logicielles et les terminaux de commande.
Complémentarité : Le Plus gère la polyvalence multimodale, tandis que le Max gère le code lourd et l’autonomie à long terme.
Accessibilité : Entièrement compatible avec les API OpenAI et Anthropic sur Alibaba Cloud.
Validation Marché : L’annonce a provoqué une hausse de 6,6 % de l’action Alibaba à Hong Kong.

Sources

Rapport de lancement et données boursières via l’actualité technologique d’Alibaba sur Perplexity.

Questions Fréquentes (FAQ)

Quelle est la différence entre Qwen3.7-Plus et Qwen3.7-Max ?

Qwen3.7-Plus est un modèle multimodal axé sur l’interaction visuelle et le pilotage d’interfaces graphiques (GUI/CLI). Qwen3.7-Max est quant à lui optimisé pour l’exécution autonome à long terme et les flux de travail complexes liés au codage informatique.

Comment accéder au modèle Qwen3.7-Plus d’Alibaba ?

Le modèle est disponible via l’API de la plateforme Model Studio d’Alibaba Cloud. Il propose des points de terminaison (endpoints) entièrement compatibles avec les standards d’OpenAI et d’Anthropic pour faciliter l’intégration.

Comment se classe Qwen3.7-Plus par rapport aux IA américaines ?

Sur la plateforme LM Arena, Qwen3.7-Plus-Preview s’est classé 16e mondial pour ses capacités en vision. Bien qu’il s’impose comme le leader des modèles chinois, il reste légèrement derrière les toutes dernières innovations d’OpenAI, Google et Anthropic.

Alibaba Qwen3.7-Plus : Le nouveau modèle multimodal qui bouscule l’IA agentique

GitHub Copilot : Tout comprendre à la facturation au token

Nvidia Nemotron 3 Ultra : Le nouveau monstre open-weight taillé pour les agents IA d’entreprise

MiniMax M3 : Le modèle open-weight chinois qui bouscule GPT-5.5 et Claude