TopoMask : Formulation basée sur des masques d'instances pour le problème de topologie routière via une architecture basée sur les Transformers

La tâche de compréhension des scènes de conduite implique la détection d'éléments statiques tels que les lignes de guidage, les panneaux de signalisation et les feux de circulation, ainsi que leurs relations mutuelles. Pour faciliter le développement de solutions de compréhension globale des scènes utilisant plusieurs vues caméra, un nouveau jeu de données appelé Road Genome (OpenLane-V2) a été publié. Ce jeu de données permet d'explorer des connexions routières complexes et des situations où les marques au sol peuvent être absentes. Au lieu d'utiliser les marques au sol traditionnelles, les lignes de guidage dans ce jeu de données sont représentées par des lignes médianes, qui offrent une représentation plus appropriée des voies et de leurs connexions.Dans cette étude, nous avons introduit une nouvelle approche appelée TopoMask pour prédire les lignes médianes dans la topologie routière. Contrairement aux méthodes existantes dans la littérature qui s'appuient sur des points clés ou des méthodes paramétriques, TopoMask utilise une formulation basée sur des masques d'instances avec une architecture à base de transformateur. Afin d'enrichir les instances de masque avec des informations de flux, une représentation d'étiquettes directionnelles est proposée. TopoMask a obtenu le 4e rang en termes de score OpenLane-V2 (OLS) et le 2e rang en termes de score F1 pour la prédiction des lignes médianes lors du défi OpenLane Topology 2023. Comparativement à la méthode actuelle state-of-the-art, TopoNet, la méthode proposée a atteint des performances similaires en détection basée sur l'indice Fréchet et surpassé TopoNet en détection basée sur la distance Chamfer sans utiliser son réseau neuronal à graphe de scène.