TopoBDA: Hin zu einer Bezier-verformbaren Aufmerksamkeit für das Verständnis von Straßen-Topologien

Das Verständnis der Straßen-Topologie ist entscheidend für autonome Fahrsysteme. In diesem Beitrag wird TopoBDA (Topology with Bezier Deformable Attention) vorgestellt, ein neuartiger Ansatz zur Verbesserung des Verständnisses der Straßen-Topologie durch Nutzung der Bezier-Deformierbaren Aufmerksamkeit (Bezier Deformable Attention, BDA). TopoBDA verarbeitet Multikamera-360-Grad-Bilder, um Bird’s Eye View (BEV)-Merkmale zu generieren, die durch einen Transformer-Decoder mit BDA verfeinert werden. Die BDA nutzt Bezier-Stützpunkte, um den deformierbaren Aufmerksamkeitsmechanismus zu steuern, wodurch die Erkennung und Darstellung von langgestreckten und dünnen Polylinienstrukturen – beispielsweise Fahrstreifenmittellinien – signifikant verbessert wird. Zudem integriert TopoBDA zwei ergänzende Komponenten: eine Instanz-Masken-Formulierungsverlustfunktion und eine One-to-Many-Set-Vorhersage-Verluststrategie, um die Detektion von Mittellinien weiter zu verfeinern und das Verständnis der Straßen-Topologie zu stärken. Experimentelle Bewertungen auf dem OpenLane-V2-Datensatz zeigen, dass TopoBDA bestehende Methoden übertrifft und state-of-the-art-Ergebnisse bei der Mittellinienerkennung und Topologie-Reasoning erzielt. Zudem erreicht TopoBDA auf dem OpenLane-V1-Datensatz die besten Ergebnisse bei der 3D-Lane-Detektion. Weitere Experimente zur Integration multimodaler Daten – wie LiDAR, Radar und SDMap – belegen, dass multimodale Eingaben das Leistungsvermögen im Bereich der Straßen-Topologie-Verarbeitung weiter steigern können.