CrossLoc3D: Luft-Boden Quellenübergreifende 3D Ortserkennung

Wir präsentieren CrossLoc3D, eine neuartige Methode zur 3D-Ortserkennung, die ein groß angelegtes Punktabstandsproblem in einem Querkanal-Szenario löst. Querkanal-Punktwolken-Daten entsprechen Punktmengen, die von Tiefensensoren mit unterschiedlicher Genauigkeit oder aus verschiedenen Entfernungen und Perspektiven aufgenommen wurden. Wir adressieren die Herausforderungen bei der Entwicklung von 3D-Ortserkennungsverfahren, die den Darstellungsunterschied zwischen Punkten berücksichtigen, die von verschiedenen Quellen erfasst werden. Unsere Methode verarbeitet Querkanal-Daten durch die Nutzung von mehrschichtigen Merkmalen und die Auswahl von Faltungskerngrößen, die den prominentesten Merkmalen entsprechen. Inspiriert durch Diffusionsmodelle verwendet unsere Methode einen neuen iterativen Verfeinerungsprozess, der die Einbettungsräume schrittweise von verschiedenen Quellen zu einem einzigen kanonischen Raum verschiebt, um das metrische Lernen zu verbessern. Zudem präsentieren wir CS-Campus3D, den ersten 3D-Luft-Boden-Querkanal-Datensatz, der Punktwolken-Daten sowohl aus Luftfahrzeug-LiDAR-Scans als auch aus Boden-LiDAR-Scans enthält. Die Punktwolken in CS-Campus3D haben Darstellungsunterschiede sowie andere Eigenschaften wie verschiedene Ansichten, Punktendichten und Rauschmuster. Wir zeigen, dass unser CrossLoc3D-Algorithmus in Bezug auf den Top-1-Durchschnittswiederherstellungswert (Average Recall) auf unserem CS-Campus3D-Benchmark eine Verbesserung von 4,74% bis 15,37% erreichen kann und Leistungen vergleichbar mit denen fortschrittlicher 3D-Ortserkennungsverfahren auf dem Oxford RobotCar-Datensatz erzielt. Der Code und der CS-Campus3D-Benchmark werden unter github.com/rayguan97/crossloc3d verfügbar sein.