DVMN: Dense Validity Mask Network für die Tiefenkompletierung

LiDAR-Tiefenkarten liefern in einer Vielzahl von Anwendungen Umgebungsinformationen. Allerdings sind solche Tiefenkarten typischerweise spärlich und für komplexe Aufgaben wie die autonome Navigation unzureichend. Moderne Ansätze nutzen bilddirektierte neuronale Netze zur Erstellung dichter Tiefenkarten. Wir entwickeln ein geführtes konvolutionales neuronales Netz, das darauf abzielt, dichte und gültige Informationen aus spärlichen Tiefenkarten zu extrahieren. Hierzu führen wir eine neuartige Schicht mit raumlich variabler und inhaltsabhängiger Dilatation ein, um zusätzliche Daten aus der spärlichen Eingabe zu integrieren. Darüber hinaus stellen wir einen sparsitätsinvarianten residualen Bottleneck-Block vor. Wir evaluieren unser Netzwerk, die Dense Validity Mask Network (DVMN), am KITTI-Tiefenkompletierungsbenchmark und erzielen Ergebnisse auf State-of-the-Art-Niveau. Zum Zeitpunkt der Einreichung ist unser Netzwerk die führende Methode, die sparsitätsinvariante Konvolution nutzt.