PVALane: Prior-gesteuerte 3D-Lane-Erkennung mit ansichtsunabhängiger Merkmalsausrichtung
Monokulare 3D-Linien-Detektion ist für ein zuverlässiges autonomes Fahren von entscheidender Bedeutung und entwickelt sich derzeit rasant weiter. Bestehende gängige Methoden basieren hauptsächlich auf vorgegebenen 3D-Anchors für die Linien-Detektion im Front-View-Raum (FV), um die Auswirkungen von Perspektivtransformationen zu mindern. Allerdings führt die perspektivische geometrische Verzerrung zwischen FV-Raum und 3D-Raum in diesem FV-basierten Ansatz zu extrem dichten Anchor-Designs, was letztlich zu verwirrenden Linienrepräsentationen führt. In diesem Artikel stellen wir eine neuartige, prior-gesteuerte Perspektive für die Linien-Detektion vor und präsentieren einen end-to-end-Framework namens PVALane, der 2D-Priorwissen nutzt, um präzise und effiziente 3D-Linien-Detektion zu ermöglichen. Da 2D-Linien-Vorhersagen starke Priorinformationen bezüglich der Existenz von Linien liefern, nutzt PVALane FV-Features, um spärliche Prior-Anchors mit potenziellen Linien im 2D-Raum zu generieren. Diese dynamischen Prior-Anchors ermöglichen es PVALane, deutliche Linienrepräsentationen zu erzielen und die Genauigkeit signifikant zu verbessern, da der Suchraum für Linien reduziert wird. Zudem nutzen wir diese Prior-Anchors, um Linien sowohl im FV- als auch im Bird-Eye-View-Raum (BEV) darzustellen, wodurch wir semantische und geometrische Informationen aus FV- und BEV-Features effektiv ausrichten und fusionieren. Umfassende Experimente auf den Datensätzen OpenLane und ONCE-3DLanes belegen die überlegene Leistung unseres Ansatzes im Vergleich zu bestehenden state-of-the-art-Methoden sowie seine hervorragende Robustheit.