HyperAIHyperAI

Command Palette

Search for a command to run...

Génération de noyaux dynamiques par des Transformers pour la détection de lignes

Kate Smith-Miles Guoqi Qian Bo Du Mingming Gong Yu Liu Ziye Chen

Résumé

Les méthodes de détection de lignes de chaussée de pointe s’appuient souvent sur des connaissances spécifiques concernant les lignes de chaussée — telles que des lignes droites ou des courbes paramétriques — afin de détecter les lignes de démarcation. Bien que ces connaissances facilitent le processus de modélisation, elles posent des défis lorsqu’il s’agit de traiter des lignes de chaussée présentant des topologies complexes (par exemple, denses, bifurquées, courbées, etc.). Récemment, les méthodes basées sur la convolution dynamique ont montré des performances prometteuses en exploitant les caractéristiques provenant de certains points clés d’une ligne de chaussée, tels que son point de départ, pour générer des noyaux de convolution, puis en appliquant ces noyaux à l’ensemble de la carte de caractéristiques afin de détecter les lignes. Bien que ces approches réduisent la dépendance aux connaissances spécifiques, les noyaux calculés à partir des points clés échouent à capturer la structure globale de la ligne de chaussée en raison de sa forme longue et fine, entraînant une détection inexacte des lignes présentant des topologies complexes. En outre, ces noyaux sont sensibles aux occlusions et aux intersections entre lignes. Pour surmonter ces limitations, nous proposons une architecture basée sur le transformer pour la génération dynamique de noyaux de convolution pour la détection de lignes de chaussée. Elle utilise un modèle transformer afin de générer des noyaux de convolution dynamiques pour chaque ligne de chaussée présente dans l’image d’entrée, puis détecte ces lignes via une convolution dynamique. Contrairement aux noyaux issus des points clés d’une ligne, ceux générés par le transformer sont capables de capturer la structure globale de la ligne à partir de l’ensemble de la carte de caractéristiques, ce qui leur permet de gérer efficacement les occlusions et les lignes de chaussée à topologie complexe. Nous évaluons notre méthode sur trois benchmarks de détection de lignes de chaussée, et les résultats démontrent sa performance de pointe. Plus précisément, notre approche atteint un score F1 de 63,40 sur OpenLane et de 88,47 sur CurveLanes, dépassant ainsi l’état de l’art respectivement de 4,30 et 2,37 points.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp