GeoTransformer: Schnell und robuste Registrierung von Punktwolken mit geometrischem Transformer

Wir untersuchen das Problem der Extraktion genauer Korrespondenzen für die Registrierung von Punktwolken. Neuere Methoden ohne Keypoints haben großes Potenzial gezeigt, indem sie die schwierige Detektion wiederholbarer Keypoints umgehen, insbesondere in Szenarien mit geringem Überlapp. Diese Methoden suchen Korrespondenzen über abgetastete Superpunkte, die dann auf dichte Punkte propagiert werden. Superpunkte werden anhand dessen, ob ihre benachbarten Patchs sich überlappen, zugeordnet. Solche spärlichen und lockeren Zuordnungen erfordern kontextuelle Merkmale, die die geometrische Struktur der Punktwolken erfassen. Wir schlagen den Geometrischen Transformer (kurz: GeoTransformer) vor, um robuste Superpunktzuordnungen durch Lernen geometrischer Merkmale zu ermöglichen. Er kodiert paarweise Abstände und dreifache Winkel, wodurch er invariant gegenüber starrer Transformation ist und in Fällen mit geringem Überlapp robust bleibt. Das einfache Design erreicht überraschend hohe Zuordnungsgenauigkeit, so dass keine RANSAC-Schritte zur Schätzung der Ausrichtungstransformation erforderlich sind, was zu einer Beschleunigung um den Faktor $100$ führt. Umfangreiche Experimente auf reichhaltigen Benchmarks, einschließlich Indoor-, Outdoor-, synthetischer, mehrfacher und nicht-starrer Szenarien, zeigen die Effizienz des GeoTransformers. Bemerkenswerterweise verbessert unsere Methode das Verhältnis der Inliners um $18{\sim}31$ Prozentpunkte und den Registrierungsrekall um mehr als $7$ Punkte im anspruchsvollen 3DLoMatch-Benchmark. Unser Code und unsere Modelle sind unter \url{https://github.com/qinzheng93/GeoTransformer} verfügbar.