Struct-MDC: Mesh-Refinierte unsupervisierte Tiefenkompletierung unter Nutzung struktureller Regularitäten aus Visual SLAM

Feature-basierte visuelle Simultaneous Localization and Mapping (SLAM)-Verfahren schätzen lediglich die Tiefe extrahierter Merkmale und erzeugen somit eine spärliche Tiefenkarte. Um dieses Spärlichkeitsproblem zu lösen, haben Tiefen-Vervollständigungsverfahren, die eine dichte Tiefe aus einer spärlichen Tiefe schätzen, in robotischen Anwendungen wie der Exploration erhebliche Bedeutung erlangt. Bestehende Methoden, die spärliche Tiefen aus visuellen SLAM-Systemen nutzen, basieren hauptsächlich auf Punktmerkmalen. Punktmerkmale weisen jedoch aufgrund von texturlosen Umgebungen und der inherenten Spärlichkeit Einschränkungen hinsichtlich der Erhaltung struktureller Regelmäßigkeiten auf. Um diesen Herausforderungen zu begegnen, führen wir die Tiefen-Vervollständigung in Kombination mit visuellem SLAM unter Verwendung von Linienmerkmalen durch, die gegenüber Punktmerkmalen eine bessere Erhaltung struktureller Regelmäßigkeiten ermöglichen. Die vorgeschlagene Methode erstellt eine konvexe Hülle durch konstruierte Delaunay-Triangulierung mit Tiefeninterpolation mittels Linienmerkmalen. Die resultierende Tiefenkarte enthält jedoch niedrigfrequente Informationen und weist Unstetigkeiten entlang der Grenze der konvexen Hülle auf. Daher schlagen wir ein Mesh-Depth-Refinement (MDR)-Modul vor, um dieses Problem zu bewältigen. Das MDR-Modul überträgt effektiv die hochfrequenten Details eines Eingabebildes auf die interpolierte Tiefe und spielt eine entscheidende Rolle bei der Brücke zwischen klassischen und tiefenlernenbasierten Ansätzen. Der vorgeschlagene Ansatz, Struct-MDC, erreicht auf öffentlichen sowie auf eigenen, kundenspezifischen Datensätzen eine bessere Leistung als andere state-of-the-art-Algorithmen und übertrifft sogar einige überwachte Methoden hinsichtlich bestimmter Metriken. Zudem wird die Wirksamkeit des vorgeschlagenen MDR-Moduls durch eine gründliche Ablationsstudie nachgewiesen.