Anthropic sort Claude Opus 4.8 avec outils dynamiques
Anthropic a lancé le 13 mai 2024 Claude Opus 4.8, la version la plus avancée de son modèle d'intelligence artificielle, disponible immédiatement sur l'ensemble de ses plateformes. Cette mise à jour intervient avec une rapidité inhabituelle, seulement 41 jours après la sortie d'Opus 4.7, afin de renforcer la compétitivité de l'entreprise face aux évolutions rapides de la concurrence, notamment chez OpenAI et Google. Le prix d'utilisation standard reste inchangé par rapport à la version précédente, fixée à 5 dollars par million de tokens d'entrée et 25 dollars pour les tokens de sortie. Claude Opus 4.8 présente des améliorations significatives sur les benchmarks de codage, de raisonnement et de compétences agentices. Les tests montrent qu'il est plus fiable, offrant un jugement plus net et une meilleure exécution des tâches complexes. Un avantage majeur réside dans sa capacité à gérer les incertitudes : le modèle est quatre fois moins susceptible que son prédécesseur de laisser passer des erreurs de code non signalées et est beaucoup plus enclin à signaler les doutes sur ses propres résultats ou données d'entrée, une caractéristique cruciale pour les applications professionnelles à haut risque comme le secteur juridique et financier. Anthropic a également introduit plusieurs nouvelles fonctionnalités accompagnant ce lancement. La première est le « flux de travail dynamique », une fonctionnalité en version de recherche intégrée à Claude Code. Elle permet au modèle de gérer des tâches à très grande échelle en planifiant l'exécution et en lançant des centaines de sous-agents en parallèle dans une seule session. Cette capacité est particulièrement utile pour des migrations de codebase couvrant des centaines de milliers de lignes de code, avec vérification automatique des résultats avant retour à l'utilisateur. Pour les utilisateurs de l'interface web, un contrôle du niveau d'effort a été ajouté, permettant de choisir entre une réponse rapide ou une analyse plus profonde et détaillée, offrant ainsi une meilleure gestion des limites de vitesse. De plus, l'API des messages a été mise à jour pour permettre aux développeurs d'intégrer des entrées système directement dans le flux de messages, facilitant la mise à jour des instructions ou des permissions en cours de tâche sans rompre le cache du prompt. La vitesse d'exécution a également été optimisée avec un mode rapide, fonctionnant à 2,5 fois la vitesse normale et désormais trois fois moins coûteux que les versions antérieures. Malgré ces percées, le modèle le plus puissant d'Anthropic, Mythos, demeure en retrait. Actuellement disponible en version préliminaire limitée pour des projets de cybersécurité, son déploiement général est reporté jusqu'à l'achèvement de garde-fous de sécurité avancés. L'entreprise espère cependant rendre ces capacités accessibles à tous ses clients dans les prochaines semaines, marquant ainsi une nouvelle étape dans la course à l'intelligence artificielle de pointe.
