HyperAIHyperAI

Command Palette

Search for a command to run...

OpenAI GPT-5.5 sur infra NVIDIA

OpenAI a lancé la version 5.5 de son modèle GPT-5.5, qui alimente désormais son application de codage agentic appelée Codex. Cette mise à niveau majeure s'exécute sur des infrastructures matérielles de nouvelle génération fournies par NVIDIA, spécifiquement les systèmes en rack GB200 NVL72. Plus de 10 000 employés de NVIDIA ont déjà accès à cette technologie à travers divers départements, y compris l'ingénierie, les ventes et les ressources humaines, signalant des gains de productivité majeurs. L'adoption de Codex repose sur des avantages économiques et techniques significatifs. Le matériel GB200 NVL72 permet une réduction de 35 % du coût par million de tokens traités et offre une vitesse de production de tokens 50 fois supérieure par mégawatt par rapport aux systèmes précédents. Ces performances rendent viable l'inférence de modèles de pointe à l'échelle de l'entreprise. Concrètement, les cycles de débogage qui s'étendaient auparavant sur plusieurs jours sont désormais conclus en quelques heures. De plus, l'expérimentation qui nécessitait des semaines est réduite à un temps de traitement nocturne, même sur des bases de code complexes à plusieurs fichiers. Les équipes parviennent à livrer des fonctionnalités complètes directement à partir de simples invites en langage naturel, avec une fiabilité accrue et une moindre consommation de ressources. La sécurité et la conformité sont des piliers centraux de ce déploiement. Afin d'opérer dans des environnements d'entreprise sécurisés, l'application Codex utilise des connexions SSH distantes vers des machines virtuelles cloud approuvées. Cela permet aux agents d'accéder et de traiter les données réelles de l'entreprise sans les exposer à l'extérieur. Le département informatique de NVIDIA a déployé des machines virtuelles dédiées pour chaque employé, créant un bac à sable qui garantit le fonctionnement à pleine puissance de l'agent tout en maintenant une traçabilité complète. Une politique de non-conservation des données régit l'ensemble du déploiement, et les agents accèdent aux systèmes de production avec des permissions en lecture seule via des interfaces de ligne de commande. Cette réussite illustre la profondeur de la collaboration entre NVIDIA et OpenAI, qui s'étend sur plus d'une décennie. Partenaires depuis 2016, les deux entreprises ont travaillé conjointement sur l'ensemble de la pile technologique de l'intelligence artificielle. Jensen Huang, fondateur et PDG de NVIDIA, a souligné l'importance de cette synergie, rappelant qu'il a personnellement livré le premier superordinateur DGX-1 à OpenAI. OpenAI est également un partenaire de conception précoce pour le silicium de NVIDIA, fournissant des retours d'information qui orientent la roadmap matérielle, tout en bénéficiant d'un accès anticipé aux nouvelles architectures. Cette alliance a permis le lancement réussi du premier cluster GB200 NVL72 de 100 000 GPU, établissant un nouveau record de fiabilité système à l'échelle de pointe. Pour soutenir les besoins futurs, OpenAI s'est engagé à déployer plus de 10 gigawatts d'équipements NVIDIA pour son infrastructure de génération d'IA, ce qui positionnera des millions de GPU NVIDIA au cœur de l'entraînement et de l'inférence des modèles pour les années à venir. Selon Jensen Huang, dans un courriel interne incitant tous les employés à utiliser Codex, l'objectif est d'accélérer l'adoption de l'IA : « Passons à la vitesse lumière. Bienvenue à l'ère de l'IA ». L'utilisation de GPT-5.5 sur l'infrastructure NVIDIA marque ainsi une étape décisive dans l'intégration des agents autonomes au travail cognitif quotidien.

Liens associés