Anthropic lance Claude Sonnet 4.5 pour renforcer sa position en intelligence codante
Anthropic a lancé le 29 septembre 2025 sa nouvelle version de modèle, Claude Sonnet 4.5, en se présentant comme le meilleur système d’intelligence artificielle dédié au codage au monde. Ce lancement, intervenu quatre mois seulement après la sortie de Sonnet 4, illustre la cadence rapide de l’entreprise dans la course aux modèles génératifs. En s’appuyant sur des benchmarks rigoureux comme SWE-Bench Verified, Sonnet 4.5 atteint 77,2 % de performance, et jusqu’à 82 % avec une stratégie d’exécution parallèle, dépassant ainsi GPT-5 Codex (74,5 %) et Gemini 2.5 Pro (67,2 %). Sur d’autres tests comme OSWorld et Terminal-Bench, il affiche des résultats significativement supérieurs à ceux de ses concurrents, notamment en gestion d’interfaces réelles et de lignes de commande. L’un des points forts de Sonnet 4.5 réside dans sa capacité à fonctionner de manière autonome pendant plus de 30 heures, soit plus de quatre fois la durée d’endurance de son prédécesseur Opus 4.1. Des tests internes ont montré qu’il a pu développer une application de messagerie similaire à Slack, en écrivant près de 11 000 lignes de code, configurer une base de données, acheter un domaine et effectuer une audit de sécurité. Le blogueur Simon Willison a également validé son efficacité en faisant reproduire son projet de modèle d’IA, avec une migration de la structure de conversation en arbre, réussie à 100 %. Pour exploiter ces capacités, Anthropic a renforcé son écosystème développeurs avec plusieurs outils majeurs. Le Claude Agent SDK, désormais disponible, permet de construire des agents intelligents contextuels, en résolvant des défis comme la mémoire à long terme, la coordination entre agents et l’équilibre entre autonomie et sécurité. La version 2.0 de Claude Code intègre un système de « checkpoints » permettant de revenir à un état antérieur en cas d’erreur, ainsi qu’un plugin natif pour VS Code et des flux de terminal améliorés. Sur le plan économique, Claude Code génère désormais plus de 500 millions de dollars de revenus annuels, avec une croissance de plus de 10 fois en trois mois. Le modèle est tarifé à 3 dollars par million de tokens d’entrée et 15 pour les sorties, positionnant Anthropic entre OpenAI (1,25/10) et son propre modèle haut de gamme Opus (15/75). Malgré ses avancées, des failles de sécurité ont été rapidement mises en évidence, notamment par le chercheur Pliny the Liberator, qui a contourné les barrières de sécurité en quelques minutes. Bien que Anthropic affirme que Sonnet 4.5 est le modèle « le plus aligné » jamais produit, avec une réduction significative des comportements indésirables comme la flatterie ou la recherche de pouvoir, les classifications de risque restent sujettes à des faux positifs, entraînant parfois des interruptions inattendues des conversations. En définitive, Anthropic ne se contente plus de proposer un modèle de pointe : il construit un écosystème complet, passant du « modèle comme service » au « plateau comme service ». En combinant performance, outils pratiques et sécurité, l’entreprise vise à fidéliser les développeurs, un enjeu clé dans la guerre des IA. Bien que des concurrents comme Google avec Gemini 3 ou OpenAI puissent bientôt réagir, Anthropic a pris une avance stratégique en transformant l’IA en un véritable partenaire de développement fiable et productif.