HyperAIHyperAI
il y a 2 mois

PersFormer : Détection de voies en 3D par le biais du Perspective Transformer et du benchmark OpenLane

Chen, Li ; Sima, Chonghao ; Li, Yang ; Zheng, Zehan ; Xu, Jiajie ; Geng, Xiangwei ; Li, Hongyang ; He, Conghui ; Shi, Jianping ; Qiao, Yu ; Yan, Junchi
PersFormer : Détection de voies en 3D par le biais du Perspective Transformer et du benchmark OpenLane
Résumé

Des méthodes de détection de voies en 3D ont été récemment proposées pour résoudre le problème des tracés de voies inexactes dans de nombreux scénarios d conduite autonome (montée/descente de côte, bosses, etc.). Les travaux précédents peinaient dans les cas complexes en raison de leurs conceptions simplistes de la transformation spatiale entre la vue frontale et la vue aérienne (BEV) ainsi que du manque d'un ensemble de données réaliste. Pour répondre à ces problèmes, nous présentons PersFormer : un détecteur monulaire de voies en 3D basé sur un module novateur de transformation des caractéristiques spatiales utilisant le Transformer. Notre modèle génère des caractéristiques BEV en se concentrant sur les régions locales frontales pertinentes avec les paramètres caméra comme référence. PersFormer adopte une conception d'ancre unifiée 2D/3D et une tâche auxiliaire pour détecter simultanément les voies 2D et 3D, ce qui améliore la cohérence des caractéristiques et partage les avantages de l'apprentissage multi-tâches. De plus, nous mettons à disposition l'un des premiers grands ensembles de données réelles de voies en 3D : OpenLane, doté d'une annotation de haute qualité et d'une diversité de scénarios. OpenLane contient 200 000 images, plus de 880 000 voies au niveau des instances, 14 catégories de voies, ainsi que des balises de scène et des annotations d'objets situés près du chemin pour encourager le développement des méthodes de détection de voies et d'autres techniques liées à la conduite autonome industrielle. Nous montrons que PersFormer surpasse considérablement les lignes directrices concurrentes dans la tâche de détection de voies en 3D sur notre nouveau jeu de données OpenLane ainsi que sur le jeu de données synthétique Apollo 3D Lane, tout en étant comparable aux algorithmes les plus avancés dans la tâche 2D sur OpenLane. La page du projet est disponible à l'adresse https://github.com/OpenPerceptionX/PersFormer_3DLane et le jeu de données OpenLane est fourni à https://github.com/OpenPerceptionX/OpenLane.