RESA : Agrégateur de décalage de caractéristiques récurrent pour la détection de lignes

La détection des lignes est l'une des tâches les plus importantes dans les véhicules autonomes. En raison des scénarios complexes variés (par exemple, occlusion sévère, lignes ambigües, etc.) ainsi que du manque de signaux de supervision riches inhérents aux annotations de lignes, cette tâche reste particulièrement difficile. Par conséquent, il est difficile pour les réseaux de neurones convolutifs classiques (CNN) d’apprendre efficacement dans des scénarios généraux afin de capturer des caractéristiques subtiles des lignes à partir d’images brutes. Dans cet article, nous proposons un nouveau module nommé REcurrent Feature-Shift Aggregator (RESA), conçu pour enrichir les caractéristiques des lignes après une extraction initiale de caractéristiques par un CNN classique. Le module RESA exploite les priorités de forme fortes propres aux lignes et capture les relations spatiales entre les pixels à travers les lignes et les colonnes. Il effectue des décalages récurrents de la carte de caractéristiques découpées dans les directions verticale et horizontale, permettant à chaque pixel de rassembler des informations globales. Grâce à l’agrégation des cartes de caractéristiques découpées, RESA parvient à prédire avec précision les lignes même dans des scénarios extrêmement difficiles où les indices visuels sont faibles. En outre, nous proposons un décodeur à redimensionnement bilatéral qui combine, lors de l’étape de redimensionnement, des caractéristiques à faible et à haute résolution. Ce décodeur permet de restaurer minutieusement la carte de caractéristiques à faible résolution en une prédiction pixel par pixel. Notre méthode atteint des résultats de pointe sur deux benchmarks populaires pour la détection de lignes (CULane et Tusimple). Le code source est disponible à l’adresse suivante : https://github.com/ZJULearning/resa.