HyperAI
Back to Headlines

Claude 4.1 Opus : une avancée majeure en programmation, des améliorations futures en perspective

il y a 2 jours

Le 5 août 2025, Anthropic a dévoilé Claude Opus 4.1, une mise à jour significative de son modèle phare Claude Opus 4, axée sur les tâches d’agence, le codage dans des scénarios réels et le raisonnement. Cette version, déjà disponible pour les utilisateurs payants, dans Claude Code, ainsi que via l’API, Amazon Bedrock et Google Cloud Vertex AI, conserve les mêmes tarifs que son prédécesseur : 15 dollars par million de tokens d’entrée et 75 dollars pour les tokens de sortie, la rendant l’un des modèles d’IA les plus chers du marché. Claude Opus 4.1 marque une avancée notable en matière de programmation, atteignant 74,5 % sur le benchmark SWE-bench Verified, soit une amélioration de 2 points par rapport à Opus 4 (72,5 %), dépassant ainsi les performances d’OpenAI o3 (69,1 %) et de Google Gemini 2.5 Pro (67,2 %). Sur le test Terminal-Bench, il atteint 43,3 % contre 39,2 % pour Opus 4, largement devançant ses concurrents. GitHub souligne des progrès particulièrement marqués dans la refonte de code multi-fichiers. Rakuten Group met en avant sa précision dans la correction de bugs dans de grands codes sans introduire de modifications inutiles. Windsurf, racheté par Cognition, observe une amélioration d’un écart-type sur son benchmark junior, comparable à la progression entre Sonnet 3.7 et Sonnet 4. En matière de sécurité, Claude Opus 4.1 opère sous le cadre ASL-3, le niveau le plus strict d’Anthropic. Le taux de rejet de demandes non conformes passe de 97,27 % à 98,76 %, renforçant sa fiabilité. Toutefois, ses performances dans d’autres domaines restent mitigées : 80,9 % sur GPQA Diamond (contre 86,4 % pour Gemini 2.5 Pro et 83,3 % pour o3), et des résultats équilibrés sur AIME et MMMU. Cette mise à jour reflète une stratégie ciblée : consolider la position d’Anthropic sur le marché lucratif du codage assisté par IA. En seulement sept mois, son revenu annuel récurrent (ARR) est passé de 10 à près de 50 milliards de dollars, porté par les revenus API et la croissance explosive de Claude Code, dont le chiffre d’affaires annuel atteint près de 4 milliards de dollars, en hausse de 100 % récente. Ces résultats financiers soutiennent une levée de fonds en cours, visant 50 milliards de dollars menée par Iconiq Capital, avec une valorisation cible de 1700 milliards de dollars – presque trois fois celle de mars (615 milliards). Cela positionne Anthropic comme l’un des plus grands unicornes mondiaux, derrière OpenAI et SpaceX. Anthropic annonce par ailleurs des améliorations « substantielles » à venir dans les semaines à venir, une réponse stratégique directe à l’attente autour de GPT-5, dont la sortie est anticipée. Cette évolution montre une évolution de la stratégie de l’entreprise : passer d’une approche de lancement épique à une cadence d’innovation continue, en phase avec la dynamique accélérée de l’IA. La bataille pour la domination technologique entre les géants de l’IA entre donc dans une nouvelle phase, plus intense et plus rapide.

Related Links