HyperAIHyperAI

Command Palette

Search for a command to run...

PersFormer: 3D-Lane-Erkennung durch Perspective Transformer und den OpenLane-Benchmark

Zusammenfassung

Zur Lösung des Problems ungenauer Fahrstreifenlayoute in vielen Szenarien des autonomen Fahrens (z.B. bergauf/bergauf, Unebenheiten usw.) wurden kürzlich Methoden zur 3D-Erkennung von Fahrstreifen vorgeschlagen. Frühere Arbeiten hatten Schwierigkeiten mit komplexen Fällen aufgrund ihrer einfachen Konzepte der räumlichen Transformation zwischen Frontansicht und Vogelperspektive (BEV) sowie dem Mangel an einem realistischen Datensatz. In Anbetracht dieser Herausforderungen präsentieren wir PersFormer: einen end-to-end monokularen 3D-Fahrstreifen-Detektor mit einem neuartigen Transformer-basierten Modul zur räumlichen MerkmalsTransformation. Unser Modell erzeugt BEV-Merkmale durch die Aufmerksamkeit auf relevante lokale Regionen der Frontansicht, wobei Kameraparameter als Referenz dienen. PersFormer verwendet ein einheitliches Design für 2D- und 3D-Ankerpunkte sowie eine Nebenaufgabe, um gleichzeitig 2D- und 3D-Fahrstreifen zu erkennen, was die Merkmalskonsistenz erhöht und die Vorteile des Multi-Task-Learnings nutzt. Darüber hinaus veröffentlichen wir einen der ersten großen realweltlichen 3D-Fahrstreifendatensätze: OpenLane, mit hochwertiger Annotation und vielfältigen Szenarien. OpenLane enthält 200.000 Frames, über 880.000 instanzbasierte Fahrstreifen, 14 Fahrstreifenkategorien sowie Szene-Tags und Annotationen von Objekten im geschlossenen Pfad, um die Entwicklung von Fahrstreifenerkennungsverfahren und industriellen autonomen Fahrens zu fördern. Wir zeigen, dass PersFormer in der Aufgabe der 3D-Fahrstreifenerkennung auf unserem neuen OpenLane-Datensatz sowie auf dem Apollo 3D Lane Synthetic Datensatz deutlich besser abschneidet als wettbewerbsfähige Baseline-Verfahren und auch im Bereich des Standes der Technik in der 2D-Aufgabe auf OpenLane mithält. Die Projektseite ist unter https://github.com/OpenPerceptionX/PersFormer_3DLane verfügbar, und der OpenLane-Datensatz wird unter https://github.com/OpenPerceptionX/OpenLane bereitgestellt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp