OpenAI publie une préversion de GPT-5.6 : trois modèles dévoilés simultanément pour renforcer les capacités en matière de codage, de sécurité et d'agents
Le 27 juin local, OpenAI a officiellement lancé la version bêta de sa série GPT-5.6. Cette nouvelle gamme comprend le modèle phare Sol, destiné à l'inférence haute performance ; Terra, un modèle milieu de gamme conçu pour les tâches à haut débit ; et Luna, un modèle léger positionné comme une option rentable pour les applications d'intelligence artificielle quotidiennes. La veille, des médias avaient rapporté que, sur demande du gouvernement Trump, OpenAI ajusterait son calendrier de lancement de nouveaux modèles et ouvrirait les tests dans un périmètre limité en priorité. Selon OpenAI, la série GPT-5.6 améliore significativement ses capacités spécialisées dans des domaines tels que la génération de code, la cybersécurité et la biologie, tout en renforçant sa capacité d'inférence continue et d'exécution lors de tâches longues impliquant des agents autonomes. Le modèle phare Sol est facturé 5 dollars par million de tokens d'entrée et 30 dollars par million de tokens de sortie ; Terra coûte environ la moitié de ce prix, tandis que Luna vise encore plus bas pour toucher un public élargi de développeurs et d'utilisateurs entreprises. Outre la version standard, OpenAI propose deux modes supplémentaires pour Sol : le mode « Max », optimisé pour les tâches complexes nécessitant un raisonnement approfondi, et le mode « Ultra », capable de mobiliser plusieurs sous-agents travaillant en collaboration afin d'étendre davantage ses compétences face aux scénarios complexes. La sécurité reste au cœur de cette publication. OpenAI indique que GPT-5.6 a été spécifiquement entraînée pour rejeter toute tentative d'intrusion malveillante ou de contournement (« jailbreak ») visant à masquer de véritables intentions hostiles envers le modèle. L'entreprise précise que Sol excelle plutôt dans l'aide apportée aux développeurs pour identifier et corriger des failles de sécurité, sans exécuter lui-même des cycles complets d'attaques cybernétiques ; ainsi, il ne franchit pas le seuil critique défini par son propre cadre interne de préparation (« Preparedness Framework »). Pour valider la robustesse sécuritaire des modèles, OpenAI révèle avoir consacré environ 700 000 heures-gpu A100e à des tests automatisés menés par des équipes rouges internes, tout en sollicitant des chercheurs indépendants en sécurité pour une évaluation continue. Ces essais se poursuivront durant les deux prochaines semaines. Par ailleurs, l'organisation signale qu'en raison de la surveillance étroite exercée par le gouvernement américain pendant cette phase de test préliminaire, certaines requêtes légitimes relevant de contextes à double usage (« Dual-use »), notamment liés à la cybersécurité, pourraient être incorrectement bloquées par mesure de prudence – un aspect clé de la validation actuelle. Enfin, selon OpenAI, la série GPT-5.6 devrait bientôt être accessible à un nombre croissant d'utilisateurs dans les prochaines semaines. L'entreprise réaffirme son engagement en faveur d'une disponibilité généralisée des modèles et souligne que cet accord avec le gouvernement américain, limitant temporairement l'accès via une phase pilote restreinte, constitue une disposition exceptionnelle. Elle espère dès lors que les futurs déploiements s'appuieront sur des procédures d'autorisation plus régulières et reproductibles, évitant ainsi une dépendance prolongée à l'évaluation cas par cas par les autorités publiques.
