Lane Graph Estimation für die Szenenverstehens in urbanen Fahrzeugumgebungen

Geländeniveaueinzelheiten (Lane-level scene annotations) liefern wertvolle Daten für die Trajektorienplanung autonomer Fahrzeuge in komplexen Umgebungen wie städtischen Gebieten und Städten. Die Erhebung solcher Daten ist jedoch zeitaufwendig und kostspielig, da die Linieneintragungen manuell durch Menschen vorgenommen werden müssen und sich daher schwer auf große Gebiete skalieren lassen. In dieser Arbeit stellen wir einen neuartigen Ansatz zur Schätzung der Liniengeometrie aus Vogel-Augen-Perspektive-Bildern vor. Wir formulieren das Problem der Schätzung von Liniengestalt und Linienschnittstellen als ein Graph-Schätzungsproblem, wobei Linienschnittpunkte als Knoten und Liniensegmente als Kanten im Graphen modelliert werden. Wir trainieren ein Graph-Schätzungsmodell auf multimodalen Vogel-Augen-Perspektive-Daten, die aus dem etablierten NuScenes-Datensatz und dessen Karten-Erweiterungspaket verarbeitet wurden. Zudem schätzen wir mit einem separaten Modell die Richtung jeder Linienschnittstelle, was zu einem gerichteten Liniengraphen führt. Wir demonstrieren die Leistungsfähigkeit unseres LaneGraphNet-Modells am anspruchsvollen NuScenes-Datensatz und liefern eine umfassende qualitative und quantitative Bewertung. Unser Modell zeigt vielversprechende Ergebnisse für die meisten untersuchten städtischen Szenen und kann als erster Schritt hin zu einer automatisierten Generierung hochauflösender Linieneintragungen für autonome Fahrsysteme dienen.