OpenAI dévoile une nouvelle app Mac pour un coding agentiel plus rapide et intelligent
OpenAI lance une nouvelle application Mac pour un développement logiciel agencé L’intelligence artificielle révolutionne déjà profondément la manière dont le logiciel est écrit, avec une grande partie du travail technique désormais confiée à des systèmes d’agents autonomes et de sous-agents. Alors que les développeurs expérimentent de nouveaux formats d’interface pour mieux collaborer avec l’IA, les laboratoires les plus avancés peinent parfois à suivre ce rythme accéléré. L’ère du développement logiciel agencé — où des agents IA peuvent s’occuper de tâches de programmation de manière autonome — s’est notamment affirmée avec des outils comme Claude Code ou Cowork. En parallèle, OpenAI a progressivement développé son outil Codex, lancé initialement en ligne de commande en avril dernier, puis disponible via une interface web un mois plus tard. Aujourd’hui, la société franchit une étape décisive : elle dévoile une nouvelle application dédiée à Codex pour macOS, intégrant plusieurs pratiques agencées de pointe apparues au cours de l’année écoulée. Cette application permet de faire fonctionner plusieurs agents simultanément, en combinant leurs compétences et en suivant des flux de travail modernes. Ce lancement intervient à peine deux mois après le lancement de GPT-5.2-Codex, le modèle de codage le plus puissant d’OpenAI, dont la société espère qu’il pourra attirer les utilisateurs de Claude Code. « Si vous devez réaliser un travail complexe et sophistiqué, GPT-5.2 est, de loin, le modèle le plus performant », a déclaré le PDG Sam Altman lors d’un appel de presse. « Mais il a été difficile à utiliser jusqu’à présent. En intégrant cette puissance de modèle dans une interface plus souple, nous pensons que cela va faire une grande différence. » Bien que la confiance d’Altman soit compréhensible, les benchmarks de codage révèlent une image plus nuancée. GPT-5.2 occupe toujours la première place sur TerminalBench, un test évaluant la capacité de l’IA à manipuler des tâches en ligne de commande, au moment de la rédaction. Toutefois, les agents de Gemini 3 et Claude Opus affichent des résultats comparables, à une marge d’erreur près. Sur SWE-bench, une évaluation plus réaliste qui teste la capacité à corriger des bogues dans des projets logiciels réels, aucune avance claire pour GPT-5.2 n’est observée. En outre, les cas d’usage agencés restent difficiles à évaluer de manière standardisée, et l’expérience utilisateur peut varier considérablement selon les modèles. L’application Codex pour Mac propose également plusieurs fonctionnalités nouvelles visant à rattraper ou dépasser les concurrents. Elle permet d’automatiser des tâches qui s’exécutent en arrière-plan selon un planning, avec les résultats placés dans une file d’attente pour être consultés plus tard. Les utilisateurs peuvent aussi choisir différentes « personnalités » pour leurs agents — pragmatiques, empathiques, etc. — afin de s’adapter à leur style de travail. Mais pour OpenAI, le point fort reste la vitesse de développement que permet l’IA. « Vous pouvez partir d’une feuille blanche, et en quelques heures, construire un logiciel assez sophistiqué », a affirmé Altman. « Aussi vite que je peux taper de nouvelles idées, c’est la limite de ce qui peut être construit. »
