SPIN Road Mapper : Extraction de routes à partir d’images aériennes par raisonnement graphique dans l’espace spatial et l’espace d’interaction pour la conduite autonome

L’extraction des routes constitue une étape essentielle dans la mise en œuvre de systèmes de navigation autonome. La détection des segments routiers s’avère particulièrement difficile en raison de leur largeur variable, de leurs ramifications multiples à travers l’image, ainsi que de leur occlusion fréquente par des éléments du terrain, des nuages ou d’autres conditions météorologiques. L’utilisation exclusive de réseaux de neurones à convolution (ConvNets) s’avère inefficace pour ce problème, car ces réseaux peinent à capturer les dépendances à longue portée entre les segments routiers, ce qui est crucial pour établir la connectivité routière. À cet effet, nous proposons un module de raisonnement graphique sur l’espace spatial et l’espace d’interaction (SPIN), intégrable dans un ConvNet, qui effectue un raisonnement sur des graphes construits à partir des cartes de caractéristiques projetées dans les espaces spatial et d’interaction. Le raisonnement dans l’espace spatial permet d’extraire les dépendances entre différentes régions spatiales ainsi que d’acquérir des informations contextuelles pertinentes. Le raisonnement dans l’espace d’interaction projeté contribue à une délimitation précise des routes par rapport aux autres topographies présentes dans l’image. Ainsi, le module SPIN permet d’extraire efficacement des dépendances à longue portée entre les segments routiers et de bien séparer les routes des autres catégories sémantiques. Nous introduisons également une pyramide SPIN, qui applique le raisonnement graphique SPIN à plusieurs échelles afin d’extraire des caractéristiques multi-échelles. Nous proposons un réseau basé sur des modules en forme d’horloge empilés et une pyramide SPIN, qui atteint des performances supérieures à celles des méthodes existantes. En outre, notre méthode est particulièrement efficace sur le plan computationnel et accélère significativement la convergence pendant l’entraînement, la rendant ainsi adaptée à l’application sur de grandes images aériennes haute résolution. Le code est disponible à l’adresse suivante : https://github.com/wgcban/SPIN_RoadMapper.git.