HyperAIHyperAI
il y a 18 jours

Génération de noyaux dynamiques par des Transformers pour la détection de lignes

{Kate Smith-Miles, Guoqi Qian, Bo Du, Mingming Gong, Yu Liu, Ziye Chen}
Génération de noyaux dynamiques par des Transformers pour la détection de lignes
Résumé

Les méthodes de détection de lignes de chaussée de pointe s’appuient souvent sur des connaissances spécifiques concernant les lignes de chaussée — telles que des lignes droites ou des courbes paramétriques — afin de détecter les lignes de démarcation. Bien que ces connaissances facilitent le processus de modélisation, elles posent des défis lorsqu’il s’agit de traiter des lignes de chaussée présentant des topologies complexes (par exemple, denses, bifurquées, courbées, etc.). Récemment, les méthodes basées sur la convolution dynamique ont montré des performances prometteuses en exploitant les caractéristiques provenant de certains points clés d’une ligne de chaussée, tels que son point de départ, pour générer des noyaux de convolution, puis en appliquant ces noyaux à l’ensemble de la carte de caractéristiques afin de détecter les lignes. Bien que ces approches réduisent la dépendance aux connaissances spécifiques, les noyaux calculés à partir des points clés échouent à capturer la structure globale de la ligne de chaussée en raison de sa forme longue et fine, entraînant une détection inexacte des lignes présentant des topologies complexes. En outre, ces noyaux sont sensibles aux occlusions et aux intersections entre lignes. Pour surmonter ces limitations, nous proposons une architecture basée sur le transformer pour la génération dynamique de noyaux de convolution pour la détection de lignes de chaussée. Elle utilise un modèle transformer afin de générer des noyaux de convolution dynamiques pour chaque ligne de chaussée présente dans l’image d’entrée, puis détecte ces lignes via une convolution dynamique. Contrairement aux noyaux issus des points clés d’une ligne, ceux générés par le transformer sont capables de capturer la structure globale de la ligne à partir de l’ensemble de la carte de caractéristiques, ce qui leur permet de gérer efficacement les occlusions et les lignes de chaussée à topologie complexe. Nous évaluons notre méthode sur trois benchmarks de détection de lignes de chaussée, et les résultats démontrent sa performance de pointe. Plus précisément, notre approche atteint un score F1 de 63,40 sur OpenLane et de 88,47 sur CurveLanes, dépassant ainsi l’état de l’art respectivement de 4,30 et 2,37 points.