HyperAI超神经

Le 23 octobre 2024, Alibaba a annoncé Qwen3-Coder, un modèle de code avancé conçu pour des tâches agentes, c'est-à-dire capables de prendre des décisions autonomes et d'interagir avec des outils. Le modèle le plus puissant, Qwen3-Coder-480B-A35B-Instruct, est un modèle à experts mixtes de 480 milliards de paramètres, avec 35 milliards de paramètres actifs. Il supporte nativement une longueur de contexte de 256 000 tokens, pouvant atteindre 1 million avec des méthodes d'extrapolation. Ce modèle bat les meilleurs modèles open source dans des tâches agentes comme la programmation, l'utilisation du navigateur et l'usage d'outils, et se compare à Claude Sonnet 4. Pour faciliter l'utilisation de Qwen3-Coder, Alibaba a également ouvert le code de Qwen Code, un outil en ligne de commande adapté à partir de Gemini Code. Cet outil intègre des prompts personnalisés et des protocoles d'appel de fonctions pour optimiser les performances du modèle dans les tâches de programmation agente. Qwen Code peut être installé via npm ou en téléchargeant le code source. Il prend en charge l'API OpenAI, permettant d'exploiter les fonctionnalités du modèle via des variables d'environnement ou un fichier .env. Alibaba propose également une intégration avec Claude Code, un autre outil de programmation. Pour cela, il suffit de demander une clé API sur le plateforme Model Studio d'Alibaba Cloud, puis d'installer Claude Code. Deux options sont proposées : un proxy API pour utiliser Qwen3-Coder via Claude Code, ou une configuration personnalisée via le package npm claude-code-config, qui permet de router les requêtes vers différents modèles. Les utilisateurs peuvent également configurer Qwen3-Coder via Cline, en sélectionnant le fournisseur d'API « OpenAI Compatible » et en entrant la clé obtenue via DashScope. L'API du modèle est accessible directement via Alibaba Cloud Model Studio, permettant des tests et des intégrations rapides. Qwen3-Coder a été entraîné sur un large éventail de tâches de programmation réelles, en utilisant une méthode d'apprentissage par renforcement à grande échelle. Cette approche a permis d'améliorer significativement le taux de réussite des exécutions de code, tout en apportant des gains à d'autres tâches. Le modèle a également bénéficié d'une amélioration de l'apprentissage à long terme, permettant des interactions multi-étapes avec des outils, grâce à un système capable de gérer 20 000 environnements simultanés. Les équipes d'Alibaba poursuivent leur travail pour améliorer les performances du modèle, en visant des tâches de plus en plus complexes et répétitives dans le développement logiciel. Des versions plus légères de Qwen3-Coder devraient bientôt être disponibles pour réduire les coûts de déploiement. De plus, des recherches sont en cours pour explorer si le modèle peut s'améliorer lui-même, ouvrant ainsi une voie prometteuse pour l'avenir de l'intelligence artificielle en programmation. Les experts du secteur saluent l'innovation de Qwen3-Coder, soulignant sa capacité à révolutionner la manière dont les développeurs interagissent avec les modèles d'intelligence artificielle. Alibaba continue de se positionner comme un acteur majeur dans le développement de modèles de code performants, en combinant des avancées technologiques et une approche open source.

Le nouveau modèle Qwen3-Coder révolutionne l'automatisation du codage avec une puissance inégalée

Related Links