HyperAIHyperAI

Command Palette

Search for a command to run...

Google DeepMind présente SIMA 2, un agent IA généraliste pour les mondes virtuels

Google DeepMind a dévoilé le 13 novembre 2025 une nouvelle version de son agent intelligent, SIMA 2, une avancée majeure dans le domaine de l’intelligence artificielle générale (AGI). Contrairement à son prédécesseur SIMA 1, lancé en mars 2024, qui atteignait seulement 31 % de réussite sur des tâches complexes, SIMA 2 double ses performances, atteignant 65 % de réussite dans des environnements connus, proche du taux humain de 75 %. Cette amélioration s’explique par l’intégration du modèle linguistique et de raisonnement Gemini 2.5 flash-lite, qui permet à l’agent de comprendre des objectifs élevés, de raisonner de manière explicite et d’interagir de façon autonome dans des mondes virtuels inédits. SIMA 2, ou Scalable Instructable Multiworld Agent, est conçu comme un agent « incarné » : il perçoit le monde via des images, interprète des instructions (y compris en emoji), planifie des actions et explique sa logique. Par exemple, face à la tâche « va à la maison rouge comme un tomate mûr », il raisonne : « un tomate mûr est rouge, donc je dois aller à la maison rouge ». Cette capacité à raisonner de façon explicite, rendue possible par Gemini, marque une rupture par rapport à la simple exécution d’ordres. L’un des progrès les plus significatifs est la capacité d’auto-amélioration. Contrairement à SIMA 1, entièrement entraîné sur des vidéos humaines, SIMA 2 utilise une base initiale pour générer ses propres expériences. Un modèle Gemini crée des tâches, un modèle de récompense évalue ses tentatives, et l’agent apprend par essais et erreurs, sans intervention humaine. Cette boucle d’apprentissage autonome est cruciale pour réduire la dépendance aux données humaines et approcher une intelligence véritablement généralisable. SIMA 2 a été testé avec succès dans des jeux très variés, notamment No Man’s Sky, Goat Simulator 3, MineDojo et ASKA. Dans Goat Simulator 3, dont le moteur physique chaotique et imprévisible a longtemps défait les IA, SIMA 2 parvient à accomplir des tâches complexes grâce à sa capacité à généraliser des concepts comme « utiliser un outil » ou « trouver un objet spécifique ». Ces résultats montrent une migration réussie de compétences entre environnements, une étape essentielle vers une AGI véritable. DeepMind insiste sur le fait que l’objectif n’est pas de créer un assistant de jeu, mais de construire une base pour des robots généraux. L’agent agit comme une couche de « cognition » : il comprend, planifie, raisonne, tandis que des systèmes spécialisés gèrent les mouvements physiques. Cette architecture en deux couches, déjà utilisée par des plateformes comme NVIDIA Isaac, pourrait permettre de transférer des compétences virtuelles vers le monde réel. Cependant, des limites subsistent. L’agent a une mémoire limitée, des difficultés à gérer des tâches longues, et sa performance en contrôle souris/clavier reste inférieure à celle d’un humain. L’écart entre le virtuel et le réel (sim-to-real gap) reste un défi majeur, car les environnements réels sont plus complexes et moins prévisibles que les mondes de jeu. SIMA 2 est actuellement disponible en prévisualisation limitée pour des chercheurs et développeurs. Bien qu’il ne soit pas une solution finale, il représente une avancée clé dans la quête de l’AGI, en combinant raisonnement, apprentissage autonome et généralisation. Il illustre la voie que DeepMind emprunte : former des agents capables de comprendre, d’agir et de s’améliorer dans des mondes variés, un pas essentiel vers des robots capables de s’adapter à l’imprévu du monde réel.

Liens associés

Google DeepMind présente SIMA 2, un agent IA généraliste pour les mondes virtuels | Articles tendance | HyperAI