MinkLoc3D-SI: 3D-LiDAR-Ortserkennung mit dünnen Faltungen, sphärischen Koordinaten und Intensität

Die 3D-LiDAR-Ortserkennung zielt darauf ab, eine grobe Lokalisierung in einer bereits bekannten Umgebung basierend auf einem einzelnen Scan eines rotierenden 3D-LiDAR-Sensors zu schätzen. Bestehende Lösungen für dieses Problem umfassen handgefertigte Punktwolkenbeschreibungen (z.B. ScanContext, M2DP, LiDAR IRIS) und lernbasierte Lösungen (z.B. PointNetVLAD, PCAN, LPDNet, DAGC, MinkLoc3D), die oft nur anhand von akkumulierten 2D-Scans aus dem Oxford RobotCar-Datensatz evaluiert werden. Wir stellen MinkLoc3D-SI vor, eine Lösung auf Basis dünner Faltungen, die sphärische Koordinaten von 3D-Punkten nutzt und die Intensität der 3D-LiDAR-Messungen verarbeitet. Dies verbessert die Leistung bei der Verwendung eines einzelnen 3D-LiDAR-Scans. Unsere Methode integriert Verbesserungen, die typisch für handgefertigte Beschreibungen sind (wie z.B. ScanContext), mit den effizientesten 3D-dünnen Faltungen (MinkLoc3D). Unsere Experimente zeigen verbesserte Ergebnisse bei einzelnen Scans von 3D-LiDARs (USyd Campus-Datensatz) sowie ausgezeichnete Generalisierungsfähigkeiten (KITTI-Datensatz). Die Nutzung von Intensitätsinformationen bei akkumulierten 2D-Scans (RobotCar Intensity-Datensatz) erhöht die Leistung weiter, obwohl die sphärische Darstellung keinen bemerkbaren Vorteil bringt. Insgesamt ist MinkLoc3D-SI für einzelne Scans, die von einem 3D-LiDAR erfasst werden, geeignet und somit in autonomen Fahrzeugen einsetzbar.