Dyna-DM: Dynamische objektbewusste selbstüberwachte monokulare Tiefenkarten

Die selbstüberwachte Tiefenschätzung aus einer einzigen Kamera ist in den letzten Jahren aufgrund ihrer Anwendungen in der Robotik und autonomen Fahrt intensiv untersucht worden. Viele aktuelle Arbeiten konzentrieren sich darauf, die Tiefenschätzung durch Erhöhung der Architekturkomplexität zu verbessern. In dieser Arbeit zeigen wir, dass auch state-of-the-art-Leistung erreicht werden kann, indem der Lernprozess optimiert wird, anstatt die Modellkomplexität zu erhöhen. Genauer gesagt schlagen wir vor: (i) kleine, potenziell dynamische Objekte während des Trainings zu ignorieren, und (ii) einen appearancesbasierten Ansatz zu verwenden, um die Objektpose bei wirklich dynamischen Objekten getrennt zu schätzen. Wir demonstrieren, dass diese Vereinfachungen die Nutzung der GPU-Speicher um 29 % reduzieren und gleichzeitig qualitativ sowie quantitativ verbesserte Tiefenkarten liefern. Der Quellcode ist unter https://github.com/kieran514/Dyna-DM verfügbar.