HyperAIHyperAI
vor 2 Monaten

PersFormer: 3D-Lane-Erkennung durch Perspective Transformer und den OpenLane-Benchmark

Chen, Li ; Sima, Chonghao ; Li, Yang ; Zheng, Zehan ; Xu, Jiajie ; Geng, Xiangwei ; Li, Hongyang ; He, Conghui ; Shi, Jianping ; Qiao, Yu ; Yan, Junchi
PersFormer: 3D-Lane-Erkennung durch Perspective Transformer und den OpenLane-Benchmark
Abstract

Zur Lösung des Problems ungenauer Fahrstreifenlayoute in vielen Szenarien des autonomen Fahrens (z.B. bergauf/bergauf, Unebenheiten usw.) wurden kürzlich Methoden zur 3D-Erkennung von Fahrstreifen vorgeschlagen. Frühere Arbeiten hatten Schwierigkeiten mit komplexen Fällen aufgrund ihrer einfachen Konzepte der räumlichen Transformation zwischen Frontansicht und Vogelperspektive (BEV) sowie dem Mangel an einem realistischen Datensatz. In Anbetracht dieser Herausforderungen präsentieren wir PersFormer: einen end-to-end monokularen 3D-Fahrstreifen-Detektor mit einem neuartigen Transformer-basierten Modul zur räumlichen MerkmalsTransformation. Unser Modell erzeugt BEV-Merkmale durch die Aufmerksamkeit auf relevante lokale Regionen der Frontansicht, wobei Kameraparameter als Referenz dienen. PersFormer verwendet ein einheitliches Design für 2D- und 3D-Ankerpunkte sowie eine Nebenaufgabe, um gleichzeitig 2D- und 3D-Fahrstreifen zu erkennen, was die Merkmalskonsistenz erhöht und die Vorteile des Multi-Task-Learnings nutzt. Darüber hinaus veröffentlichen wir einen der ersten großen realweltlichen 3D-Fahrstreifendatensätze: OpenLane, mit hochwertiger Annotation und vielfältigen Szenarien. OpenLane enthält 200.000 Frames, über 880.000 instanzbasierte Fahrstreifen, 14 Fahrstreifenkategorien sowie Szene-Tags und Annotationen von Objekten im geschlossenen Pfad, um die Entwicklung von Fahrstreifenerkennungsverfahren und industriellen autonomen Fahrens zu fördern. Wir zeigen, dass PersFormer in der Aufgabe der 3D-Fahrstreifenerkennung auf unserem neuen OpenLane-Datensatz sowie auf dem Apollo 3D Lane Synthetic Datensatz deutlich besser abschneidet als wettbewerbsfähige Baseline-Verfahren und auch im Bereich des Standes der Technik in der 2D-Aufgabe auf OpenLane mithält. Die Projektseite ist unter https://github.com/OpenPerceptionX/PersFormer_3DLane verfügbar, und der OpenLane-Datensatz wird unter https://github.com/OpenPerceptionX/OpenLane bereitgestellt.