GPT-5.1-Codex-Max : le nouvel acteur majeur de l’ingénierie logicielle autonome, plus puissant, plus efficace et capable de tâches à long terme
OpenAI lance GPT-5.1-Codex-Max, un nouveau modèle d’agent de codage conçu pour des tâches complexes et prolongées. Intégré à Codex, ce modèle repose sur une mise à jour de son moteur fondamental, entraîné sur des tâches agiles dans des domaines comme l’ingénierie logicielle, les mathématiques et la recherche. GPT-5.1-Codex-Max est plus rapide, plus intelligent et plus efficace en termes de tokens à chaque étape du cycle de développement, marquant une avancée vers un partenaire de codage fiable. Il est conçu pour des travaux de longue durée, notamment des refacto à grande échelle, des débogages approfondis et des boucles d’agent d’heures voire de jours. Sa particularité réside dans sa capacité native à opérer sur plusieurs fenêtres de contexte grâce à une technique appelée compaction, qui permet de conserver le contexte essentiel tout en réduisant l’historique, offrant ainsi une cohérence sur des millions de tokens dans une même tâche. Disponible dès aujourd’hui dans Codex (CLI, extension IDE, cloud, revue de code), l’accès via API est prévu prochainement. Entraîné sur des tâches réelles — création de pull requests, revue de code, développement frontend, Q&A —, il surpasse significativement les modèles précédents sur des évaluations de pointe, notamment SWE-Bench Verified et SWE-Lancer IC. Il excelle aussi en efficacité : avec un effort de raisonnement « medium », il obtient de meilleurs résultats qu’GPT-5.1-Codex tout en utilisant 30 % moins de tokens. Pour les tâches non sensibles à la latence, un nouveau niveau « xhigh » permet un raisonnement plus long, optimisant la qualité des réponses. Toutefois, le mode « medium » reste recommandé pour l’usage quotidien. La compaction permet à GPT-5.1-Codex-Max de dépasser les limites classiques de la fenêtre de contexte, rendant possibles des tâches autrefois impossibles. Le modèle compresse automatiquement son historique lorsqu’il approche sa limite, réinitialisant sa fenêtre sans perdre de cohérence. Des tests internes montrent qu’il peut fonctionner de manière autonome pendant plus de 24 heures, itérant sur ses implémentations, corrigeant les échecs de test et livrant des résultats concluants. Cette capacité à raisonner sur de longues périodes améliore ses performances sur des défis complexes, notamment en cybersécurité et en codage à long terme. Bien que GPT-5.1-Codex-Max n’atteigne pas encore le niveau « High » en cybersécurité selon le cadre de préparation d’OpenAI, il est le modèle le plus performant dans ce domaine à ce jour. L’entreprise renforce ses mesures de sécurité, notamment via des systèmes de surveillance dédiés, des blocages d’activités suspectes et des programmes comme Aardvark pour renforcer la défense. Codex fonctionne par défaut dans un environnement sécurisé (sandbox), avec accès limité aux fichiers et sans accès réseau, sauf activation explicite par l’utilisateur. L’usage d’Internet ou de recherche en ligne est déconseillé en raison des risques d’injecter des prompts malveillants. OpenAI insiste sur la nécessité d’une revue humaine des travaux générés par l’agent, même si Codex produit des logs et cite ses appels d’outils. Il doit être vu comme un assistant, non comme un remplaçant du développeur. Le déploiement itératif permet d’apprendre des usages réels et d’améliorer les protections. GPT-5.1-Codex-Max est désormais le modèle par défaut dans Codex, disponible pour les abonnés ChatGPT Plus, Pro, Business, Edu et Enterprise. Pour les développeurs utilisant la CLI via API, l’accès arrive bientôt. Les données montrent une amélioration significative : 95 % des ingénieurs OpenAI utilisent Codex hebdomadairement, et ils livrent près de 70 % de pull requests supplémentaires. GPT-5.1-Codex-Max incarne une avancée majeure vers des agents capables de gérer des workflows complexes, d’optimiser les ressources et d’augmenter la productivité, tout en restant ancré dans des principes de sécurité et de responsabilité.
