HyperAIHyperAI
vor 2 Monaten

M$^2$-3DLaneNet: Erkundung der multimodalen 3D-Lanenerkennung

Luo, Yueru ; Yan, Xu ; Zheng, Chaoda ; Zheng, Chao ; Mei, Shuqi ; Kun, Tang ; Cui, Shuguang ; Li, Zhen
M$^2$-3DLaneNet: Erkundung der multimodalen 3D-Lanenerkennung
Abstract

Die genaue Schätzung von Fahrstreifenlinien im 3D-Raum bleibt aufgrund ihrer dünnen und spärlichen Natur eine Herausforderung. Frühere Arbeiten konzentrierten sich hauptsächlich auf die Verwendung von Bildern für die 3D-Erkennung von Fahrstreifenlinien, was zu inherenten Projektionsfehlern und einem Verlust geometrischer Informationen führte. Um diese Probleme anzugehen, untersuchen wir das Potenzial der Nutzung von LiDAR für die 3D-Erkennung von Fahrstreifenlinien, sei es als eigenständige Methode oder in Kombination mit bestehenden monokularen Ansätzen. In dieser Arbeit schlagen wir M$^2$-3DLaneNet vor, um ergänzende Informationen aus mehreren Sensoren zu integrieren. Insbesondere hebt M$^2$-3DLaneNet 2D-Features in den 3D-Raum, indem es geometrische Informationen aus LiDAR-Daten durch Tiefenvervollständigung einbezieht. Anschließend werden die gehobenen 2D-Features durch eine multimodale BEV-Fusion (Bird's Eye View) mit LiDAR-Features weiter verbessert. Ausführliche Experimente auf dem groß angelegten OpenLane-Datensatz zeigen die Effektivität von M$^2$-3DLaneNet, unabhängig vom Bereich (75 m oder 100 m).