HyperAIHyperAI
il y a 17 jours

Détection de lignes avec AtrousFormer polyvalent et guidance sémantique locale

Jiaxing Yang, Lihe Zhang, Huchuan Lu
Détection de lignes avec AtrousFormer polyvalent et guidance sémantique locale
Résumé

La détection des lignes est l'une des fonctions essentielles dans les véhicules autonomes et a suscité un intérêt croissant récemment. Les réseaux destinés à segmenter les instances de lignes, en particulier celles présentant de mauvaises caractéristiques visuelles, doivent être capables d’exploiter les propriétés de distribution des lignes. La plupart des méthodes existantes s’appuient sur des techniques basées sur les réseaux de neurones convolutifs (CNN). Quelques-unes ont tenté d’intégrer le récent et populaire modèle seq2seq Transformer \cite{transformer}. Toutefois, leurs défauts inhérents — faible capacité à capter les informations globales et surcharge computationnelle importante — limitent fortement leur application à grande échelle. Dans ce travail, nous proposons Atrous Transformer (AtrousFormer) pour résoudre ce problème. Une variante, appelée local AtrousFormer, est intégrée de manière entrelacée dans le extracteur de caractéristiques afin d’améliorer l’extraction. En collectant les informations d’abord par lignes, puis par colonnes, de manière spécialisée, notre architecture acquiert une capacité renforcée à extraire les informations tout en offrant une meilleure efficacité computationnelle. Pour améliorer davantage les performances, nous introduisons également un décodeur guidé par le contexte sémantique local, qui permet une délimitation plus précise des identités et des formes des lignes, en utilisant la carte de gaussienne prédite pour le point de départ de chaque ligne comme guide. Des expérimentations étendues sur trois benchmarks exigeants (CULane, TuSimple et BDD100K) montrent que notre réseau se distingue favorablement par rapport aux méthodes de pointe.