OpenAI lance GPT-5.2 dans la course à l'IA agente
OpenAI a dévoilé GPT-5.2, sa série de modèles la plus avancée à ce jour, conçue pour les tâches professionnelles quotidiennes. Fidji Simo, directrice des applications chez OpenAI, a déclaré lors d’un point presse que ce modèle, développé pendant plusieurs mois, vise à « libérer davantage de valeur économique pour les individus ». GPT-5.2, disponible dans les versions Instant, Thinking et Pro, excelle dans des domaines clés : création de tableurs, rédaction de présentations, programmation, compréhension d’images, traitement de longs contextes, utilisation d’outils et exécution de projets complexes. Le modèle est particulièrement performant dans les tâches de type professionnel, comme le montre une évaluation interne où il a surpassé ou égalé les experts humains dans 70,9 % des tâches évaluées sur 44 métiers. Dans un test avec un chercheur en immunologie, GPT-5.2 Pro a produit des questions plus pertinentes et des explications plus solides que tout autre modèle de pointe. En matière d’agents intelligents, le modèle affiche une réduction de 38 % des hallucinations par rapport à GPT-5.1, ce qui renforce sa fiabilité pour les utilisateurs professionnels. Des entreprises comme Notion, Shopify, Zoom, Databricks et Box ont participé à des tests préliminaires. GPT-5.2 est également mieux adapté aux workflows complexes, avec une capacité accrue à gérer des tâches multi-étapes, notamment grâce à une meilleure compréhension des documents longs (jusqu’à 256k tokens) et une meilleure utilisation d’outils, comme le montre son score de 98,7 % sur le test Tau2-bench Telecom. Sur des benchmarks scientifiques et techniques, GPT-5.2 marque des progrès significatifs. Il atteint 92,4 % sur GPQA Diamond (questions scientifiques), 99,4 % sur HMMT (concours mathématiques), 88,7 % sur CharXiv (raisonnement scientifique) et 40,3 % sur FrontierMath (mathématiques avancées). En programmation, il obtient 55,6 % sur SWE-Bench Pro, démontrant une capacité supérieure à réparer des codes réels, même dans des environnements industriels complexes. Il excelle aussi en compréhension visuelle, avec une précision deux fois supérieure à celle de GPT-5.1 pour analyser des interfaces, des schémas ou des documents techniques. OpenAI souligne que GPT-5.2 est plus structuré, fiable et agréable à utiliser, tout en conservant une tonalité chaleureuse. Il est déjà disponible pour les abonnés Payant (Plus, Pro, Go, Business, Enterprise) dans ChatGPT, avec un déploiement progressif pour garantir une expérience fluide. GPT-5.1 restera accessible pendant trois mois avant d’être déprécié. Sur l’API, les modèles sont désormais disponibles avec des tarifs plus élevés (1,75 $ pour 1 million d’entrées, 14 $ pour les sorties), mais une meilleure efficacité en token réduit le coût global par tâche. OpenAI a également annoncé un partenariat stratégique avec Disney pour permettre la création de vidéos sociales utilisant des personnages de Disney, Marvel, Pixar et Star Wars, avec une participation financière de 1 milliard de dollars. Par ailleurs, une fonction de prédiction d’âge est en phase de test pour activer automatiquement des protections pour les mineurs, avant le lancement prévu de la « mode adulte » en 2026. Enfin, OpenAI a mis en place un « code rouge » interne, selon Sam Altman, pour prioriser l’amélioration de ChatGPT au détriment d’autres projets comme la publicité. GPT-5.2, construit avec les infrastructures NVIDIA et Microsoft Azure, illustre l’engagement d’OpenAI à rester en tête de l’innovation, en s’appuyant sur des partenariats stratégiques et des progrès techniques majeurs.
