HypLiLoc: Auf dem Weg zu effektiver LiDAR-Pose-Regression durch hyperbolische Fusion

Die LiDAR-Relokalisierung spielt eine entscheidende Rolle in vielen Bereichen, darunter Robotik, autonomes Fahren und Computer Vision. Die Datenbankabfrage auf Basis von LiDAR-Daten verursacht in der Regel hohe Rechen- und Speicherkosten und kann zu global ungenauen Pose-Schätzungen führen, wenn die Datenbank zu dünn besetzt ist. Andererseits regredieren Pose-Regressionsmethoden direkt globale Posen aus Bildern oder Punktwolken in einem End-to-End-Prozess. Sie führen keine Datenbankabfragen durch und sind rechnerisch effizienter als Abfragemethoden. Wir schlagen HypLiLoc vor, ein neues Modell für die LiDAR-Pose-Regression. Wir verwenden zwei verzweigte Backbones, um jeweils 3D-Features und 2D-Projektionsfeatures zu extrahieren. Wir betrachten die multimodale Feature-Fusion sowohl im euklidischen als auch im hyperbolischen Raum, um effektivere Feature-Repräsentationen zu erhalten. Experimentelle Ergebnisse zeigen, dass HypLiLoc den Stand der Technik in Outdoor- und Indoor-Datensätzen erreicht. Zudem führen wir umfangreiche Abschleifstudien zum Frameworkdesign durch, die die Effektivität der multimodalen Feature-Extraktion und der Multiraum-Einbettung demonstrieren. Unser Code ist unter folgendem Link verfügbar: https://github.com/sijieaaa/HypLiLoc