NVIDIA ENPIRE : 8 IA et 8 robots en recherche autonome
NVIDIA a dévoilé ENPIRE, un projet expérimental mené par son laboratoire GEAR et présenté par Jim Fan, responsable de l'intelligence incarnée. Cette initiative place huit agents de codage autonomes et huit robots dans un même laboratoire pour qu'ils conçoivent, exécutent et optimisent des expériences de recherche physique sans intervention humaine directe. Les chercheurs se contentent de définir les objectifs et d'observer les résultats. Chaque station dispose de bras robotisés YAM à six degrés de liberté, de caméras de profondeur Intel RealSense et d'une station de travail équipée d'un GPU RTX 5090, le tout fonctionnant en local. Le système opère en deux temps. Une phase initiale, encore assistée par l'humain, permet d'installer les infrastructures nécessaires : limites de sécurité, mécanismes de réinitialisation automatique et protocoles de vérification des succès. Une fois cette base configurée, le processus devient entièrement autonome. Les agents de codage lisent la littérature scientifique, formulent des hypothèses, ajustent les hyperparamètres des algorithmes d'apprentissage par renforcement et déploient le code sur les robots pour en tester l'efficacité sur le terrain. Parmi les trois systèmes évalués, Codex s'est avéré le plus performant en conditions réelles, devançant Claude Code et Kimi Code, qui fonctionnaient correctement en simulation mais échouaient sur le matériel physique. Les agents ont été testés sur des tâches exigeant une précision et un contrôle tactile élevés, comme l'insertion d'une épingle dans un trou de quatre millimètres, le branchement d'un GPU sur une carte mère ou la découpe de serre-flex. Pour l'insertion d'épingles, le système a atteint cinquante réussites consécutives en explorant différentes combinaisons d'apprentissage par imitation et par renforcement. L'ajout de simples termes de régularisation aux algorithmes a ainsi généré une hausse de plus de dix pour cent du taux de réussite. En parallèle, l'augmentation du nombre de robots accélère significativement le développement : passer de une à huit unités réduit le temps nécessaire pour atteindre la même performance de quarante à cinquante minutes. Cependant, cette scalabilité s'accompagne d'une consommation de tokens nettement supérieure, chaque agent devant continuellement lire et synthétiser les travaux des autres. Le projet met également en lumière un phénomène intéressant de transfert de connaissances. Lorsqu'un agent rédige un compte-rendu textuel de ses expériences, ce document est réutilisé pour accélérer l'apprentissage du même agent sur une tâche différente, prouvant que la méthodologie, et non seulement les paramètres du modèle, peut être transposée. Malgré ces progrès, ENPIRE présente des limites actuelles. L'infrastructure nécessite toujours une configuration humaine préalable pour la sécurité et la validation, et les tâches testées restent limitées à des environnements de table structurés. NVIDIA confirme que les données techniques et le code du système seront prochainement mis à disposition de la communauté.
