BEV-LaneDet: Eine einfache und effektive 3D-Lanenerkennungsbaseline

Die 3D-Spurerkennung, die eine entscheidende Rolle bei der Fahrzeugroutenplanung spielt, ist in letzter Zeit ein rasch sich entwickelndes Thema im Bereich autonomer Fahrzeuge. Frühere Arbeiten gerieten aufgrund ihrer komplizierten räumlichen Transformationen und unflexiblen Darstellungen von 3D-Spuren in Schwierigkeiten hinsichtlich der Praktikabilität. Um diese Probleme zu bewältigen, schlägt unsere Arbeit einen effizienten und robusten monokularen 3D-Spurendetektor namens BEV-LaneDet vor, der drei Hauptbeiträge leistet. Erstens führen wir die virtuelle Kamera ein, die die intrinsischen und extrinsischen Parameter von Kameras, die an verschiedenen Fahrzeugen montiert sind, vereint, um die Konsistenz der räumlichen Beziehungen zwischen den Kameras zu gewährleisten. Diese Vereinheitlichung des visuellen Raums kann das Lernverfahren effektiv fördern. Zweitens schlagen wir eine einfache aber effiziente 3D-Spurdarstellung vor, die als Key-Points Representation bezeichnet wird. Dieses Modul eignet sich besser zur Darstellung komplexer und vielfältiger 3D-Spurstrukturen. Schließlich präsentieren wir ein leichtgewichtiges und chipfreundliches Modul für räumliche Transformationen, das Spatial Transformation Pyramid (STP) genannt wird. Es transformiert mehrskalige Frontansicht-Features in Bird's Eye View (BEV)-Features.Experimentelle Ergebnisse zeigen, dass unsere Arbeit den Stand der Technik in Bezug auf den F-Wert übertrifft: Sie erzielt 10,6 % höhere Werte im OpenLane-Datensatz und 5,9 % höhere Werte im Apollo 3D-synthetischen Datensatz, wobei sie eine Geschwindigkeit von 185 FPS erreicht. Der Quellcode wird unter https://github.com/gigo-team/bev_lane_det veröffentlicht werden.