VectorMapNet: End-to-end vektorisierte HD-Karte-Lernmethode

Autonome Fahrzeugsysteme benötigen hochaufgelöste (HD) semantische Karten, um sich auf städtischen Straßen zu orientieren. Bestehende Lösungen gehen der semantischen Kartierung durch Offline-Manuelle Annotationen an, was erhebliche Skalierungsprobleme mit sich bringt. Neuere lernbasierte Methoden erzeugen dichte, rasterisierte Segmentierungsvorhersagen, um Karten zu erstellen. Diese Vorhersagen enthalten jedoch keine Instanzinformationen einzelner Kartenelemente und erfordern heuristische Nachbearbeitung, um vektorisierte Karten zu erhalten. Um diese Herausforderungen anzugehen, stellen wir einen end-to-end vektorisierten HD-Kartenerstellungspipeline vor, den wir VectorMapNet nennen. VectorMapNet verwendet Bordbeobachtungen von Sensoren und prognostiziert eine dünn besetzte Menge von Polylinien in der Vogelperspektive. Diese Pipeline kann die räumliche Beziehung zwischen Kartenelementen explizit modellieren und vektorisierte Karten generieren, die für nachgeschaltete autonome Fahrzeugtasks geeignet sind. Ausführliche Experimente zeigen, dass VectorMapNet starke Kartenerstellungsleistung sowohl auf dem nuScenes- als auch auf dem Argoverse2-Datensatz erreicht und dabei die bisher besten Methoden um 14,2 mAP und 14,6 mAP übertrifft. Qualitativ ist VectorMapNet in der Lage, umfassende Karten zu generieren und feine geometrische Details von Straßen abzubilden. Nach bestem Wissen ist VectorMapNet das erste Werk, das auf die end-to-end Vektorisierung von Karten aus Bordbeobachtungen abzielt. Unsere Projektwebsite ist unter \url{https://tsinghua-mars-lab.github.io/vectormapnet/} verfügbar.