Anticipation de l'Occupation pour une Exploration et une Navigation Efficaces

Les méthodes de navigation de pointe s'appuient sur une mémoire spatiale pour généraliser à de nouveaux environnements, mais leurs cartes d'occupation sont limitées à la capture des structures géométriques directement observées par l'agent. Nous proposons une anticipation d'occupation, dans laquelle l'agent utilise ses observations RGB-D en perspective egocentrique pour inférer l'état d'occupation au-delà des régions visibles. En procédant ainsi, l'agent construit une conscience spatiale de manière plus rapide, ce qui facilite une exploration et une navigation efficaces dans des environnements 3D. En exploitant le contexte à la fois dans les vues egocentriques et dans les cartes top-down, notre modèle parvient à anticiper une carte plus étendue de l'environnement, avec des performances nettement supérieures aux méthodes de référence robustes. En outre, lorsqu'il est déployé pour des tâches séquentielles de prise de décision telles que l'exploration et la navigation, notre modèle dépasse les méthodes de pointe sur les jeux de données Gibson et Matterport3D. Notre approche constitue la solution gagnante du Habitat PointNav Challenge 2020. Page du projet : http://vision.cs.utexas.edu/projects/occupancy_anticipation/