TransLoc3D: Ortserkennung auf großem Maßstab unter Verwendung von Punktwolken und anpassbaren Rezeptivfeldern

Die Ortserkennung spielt eine wesentliche Rolle im Bereich der autonomen Fahrzeuge und Roboter-Navigation. Methoden auf Basis von Punktwolken konzentrieren sich hauptsächlich auf die Extraktion globaler Deskriptoren aus lokalen Merkmalen von Punktwolken. Trotz ermutigender Ergebnisse ignorieren bestehende Lösungen folgende Aspekte, die zu einer Leistungsverschlechterung führen können: (1) große Größenunterschiede zwischen Objekten in Outdoor-Szenen; (2) bewegte Objekte, die für die Ortserkennung irrelevant sind; (3) langreichweitige kontextuelle Informationen. Wir zeigen, dass diese Aspekte Herausforderungen bei der Extraktion diskriminativer globaler Deskriptoren mit sich bringen. Um diese Probleme zu mildern, schlagen wir eine neuartige Methode namens TransLoc3D vor, die adaptive Rezeptivfelder mit einem punktweisen Neugewichtungsschema verwendet, um Objekte unterschiedlicher Größen zu verarbeiten und Störgeräusche zu unterdrücken, sowie einen externen Transformer zur Erfassung langreichweitiger Merkmalsabhängigkeiten. Im Gegensatz zu existierenden Architekturen, die feste und begrenzte Rezeptivfelder verwenden, profitiert unsere Methode von größenanpassbaren Rezeptivfeldern sowie globalen kontextuellen Informationen und übertrifft den aktuellen Stand der Technik durch erhebliche Verbesserungen auf gängigen Datensätzen.