Rekonstruktion aus Top-View: Ein 3D-Lanes-Detektionsansatz basierend auf geometrischem Strukturprior

In diesem Paper stellen wir einen fortschrittlichen Ansatz zur Lösung des Problems der monokularen 3D-Linien-Detektion vor, indem wir die geometrische Struktur hinter dem Prozess der 2D-zu-3D-Linien-Rekonstruktion ausnutzen. Angelehnt an frühere Methoden analysieren wir zunächst die geometrische Heuristik zwischen der 3D-Linie und ihrer 2D-Darstellung auf dem Boden und schlagen vor, explizite Supervision basierend auf strukturellen Priorwissen einzuführen. Dadurch wird es möglich, sowohl inter-lane- als auch intra-lane-Beziehungen aufzubauen, um die Rekonstruktion von 3D-Linien von lokal nach global zu fördern. Zweitens verringern wir den Strukturverlust in der 2D-Linien-Darstellung, indem wir direkt Top-View-Linieninformationen aus Front-View-Bildern extrahieren, was die Verwirrung durch entfernte Linienmerkmale in früheren Ansätzen erheblich verringert. Darüber hinaus schlagen wir eine neuartige, auf die Aufgabe zugeschnittene Daten-Augmentation-Methode vor, bei der durch Synthese neuer Trainingsdaten für sowohl die Segmentierung als auch die Rekonstruktion in unserem Pipeline-Workflow die ungleichmäßige Datenausprägung hinsichtlich Kamerapose und Geländeneigung kompensiert wird, um die Generalisierbarkeit auf unbekannte Daten zu verbessern. Unser Ansatz stellt den ersten Versuch dar, geometrische Priorwissen in DNN-basierte 3D-Linien-Detektion einzubinden, und ermöglicht es, Linien in einer außergewöhnlich großen Entfernung zu detektieren – die ursprüngliche Detektionsreichweite wird dabei verdoppelt. Der vorgeschlagene Ansatz kann problemlos in andere Frameworks integriert werden, ohne zusätzliche Kosten zu verursachen. Experimentelle Ergebnisse zeigen, dass unsere Methode state-of-the-art Ansätze auf dem Apollo 3D-Synthetic-Datensatz bei einer Echtzeit-Geschwindigkeit von 82 FPS um 3,8 Prozentpunkte im F-Score übertrifft, ohne zusätzliche Parameter einzuführen.