HyperAIHyperAI

Command Palette

Search for a command to run...

Robots capables de cartographier en temps réel de grands environnements grâce à une nouvelle méthode d’intelligence artificielle

Un robot chargé de rechercher des victimes dans un tunnel de mine effondré doit rapidement cartographier l’environnement et déterminer sa position au sein de ce dernier tout en évoluant dans un terrain dangereux. Pour relever ce défi, des chercheurs du MIT ont conçu un système innovant combinant l’intelligence artificielle moderne et les principes classiques de la vision par ordinateur. Leur approche permet de traiter un nombre illimité d’images capturées par les caméras embarquées, une avancée cruciale par rapport aux modèles existants, qui ne peuvent généralement traiter que quelques images à la fois. Ce nouveau système crée progressivement des sous-cartes 3D de la scène, puis les assemble pour former une carte complète, tout en estimant en temps réel la position du robot. Contrairement aux méthodes traditionnelles, qui nécessitent des caméras calibrées ou des réglages complexes par un expert, cette solution fonctionne « out of the box », ce qui la rend plus facile à déployer dans des applications réelles. Elle s’appuie sur une idée simple mais puissante : au lieu de tenter de reconstruire toute la scène d’un coup, le système traite des portions successives, aligne les sous-cartes en tenant compte des distorsions introduites par les modèles d’apprentissage automatique, puis les fusionne. Cette stratégie permet des reconstructions 3D précises et rapides, même dans des environnements complexes comme un couloir de bureau encombré. Les chercheurs ont identifié un obstacle majeur : les modèles d’IA peuvent introduire des déformations dans les sous-cartes (comme des murs légèrement incurvés), rendant l’alignement par simple rotation ou translation inefficace. Pour surmonter cela, ils ont adopté une approche mathématique plus souple, inspirée des méthodes classiques de vision par ordinateur, qui modélise les déformations de manière cohérente. Cette technique permet d’aligner les sous-cartes de manière robuste, même en présence d’ambiguïtés. Les résultats sont impressionnants : la reconstruction 3D est réalisée en quelques secondes, avec une erreur moyenne inférieure à 5 cm, même à partir de vidéos prises avec un téléphone portable. Le système a été testé sur des scènes réalistes comme l’intérieur de la chapelle du MIT, avec des performances supérieures à celles des méthodes existantes, sans besoin de matériel spécialisé. Cette technologie a des applications potentielles bien au-delà de la recherche et du sauvetage. Elle pourrait améliorer les expériences de réalité étendue sur des lunettes VR, ou permettre aux robots industriels de naviguer rapidement dans des entrepôts pour localiser et déplacer des marchandises. Selon Dominic Maggio, doctorant au MIT et auteur principal de l’étude, « il est désormais possible de générer une reconstruction 3D précise en quelques secondes avec un outil simple et directement utilisable ». Luca Carlone, directeur du laboratoire SPARK au MIT, souligne que la compréhension profonde de la géométrie classique, combinée à l’apprentissage automatique, est essentielle pour des solutions scalables et efficaces. Ce travail, soutenu par la NSF américaine, l’Office of Naval Research et la National Research Foundation de Corée, sera présenté à la conférence NeurIPS. Les chercheurs souhaitent désormais améliorer la robustesse de leur méthode dans des scènes extrêmement complexes et l’implémenter sur des robots réels en conditions réelles.

Liens associés

Robots capables de cartographier en temps réel de grands environnements grâce à une nouvelle méthode d’intelligence artificielle | Articles tendance | HyperAI