Konfidenzverteilung durch CNNs für geleitete dünnbesetzte Tiefenregression

Im Allgemeinen verarbeiten Faltungsneuronale Netze (CNNs) Daten auf einem regulären Gitter, z.B. Daten, die von herkömmlichen Kameras erzeugt werden. Die Entwicklung von CNNs für dünn besetzte und unregelmäßig angeordnete Eingabedaten ist jedoch weiterhin ein offenes Forschungsproblem mit zahlreichen Anwendungen im autonomen Fahren, in der Robotik und der Überwachung. In dieser Arbeit schlagen wir eine algebraisch eingeschränkte normierte Faltungsschicht für CNNs vor, die hochdünn besetzte Eingaben verarbeitet und dabei weniger Netzparameter als vergleichbare Ansätze benötigt. Wir entwickeln neuartige Strategien zur Bestimmung des Konfidenzniveaus aus der Faltungsoperation und zur Weitergabe dieses Konfidenzniveaus in aufeinanderfolgende Schichten. Darüber hinaus schlagen wir eine Zielfunktion vor, die gleichzeitig den Datend Fehler minimiert und das Ausgabekonfidenz maximiert. Um strukturelle Informationen zu integrieren, untersuchen wir auch Fusionstrategien zur Kombination von Tiefen- und RGB-Informationen in unserem Rahmenwerk für normierte Faltungsnetworks. Zudem führen wir die Verwendung des Ausgabekonfidenzes als Hilfsinformation ein, um die Ergebnisse zu verbessern. Die Leistungsfähigkeit unseres Rahmenwerks für normierte Faltungsnetworks wird am Problem der Szentieftenvervollständigung demonstriert. Detaillierte Experimente wurden an den Datensätzen KITTI-Depth und NYU-Depth-v2 durchgeführt. Die Ergebnisse zeigen deutlich, dass der vorgeschlagene Ansatz eine überlegene Leistung erzielt, während er nur etwa 1-5 % der Anzahl an Parametern im Vergleich zu den besten bisherigen Methoden benötigt.