HyperAIHyperAI
vor 16 Tagen

NDDepth: Normal-Distance-assistierte monokulare Tiefenschätzung

Shuwei Shao, Zhongcai Pei, Weihai Chen, Xingming Wu, Zhengguo Li
NDDepth: Normal-Distance-assistierte monokulare Tiefenschätzung
Abstract

Die monokulare Tiefenschätzung hat aufgrund ihrer vielfältigen Anwendungen weite Aufmerksamkeit in der Computer Vision-Community erhalten. In diesem Paper stellen wir einen neuartigen, physik (Geometrie)-getriebenen tiefen Lernansatz für die monokulare Tiefenschätzung vor, indem wir annehmen, dass 3D-Szenen aus stückweise ebenen Strukturen bestehen. Insbesondere führen wir einen neuen Normalen-Abstandskopf ein, der auf Pixel-Ebene die Flächennormalen und die Abstände von Ebenen zum Ursprung liefert, um an jeder Position die Tiefe abzuleiten. Gleichzeitig werden Normalen und Abstände durch eine neu entwickelte ebenenbewusste Konsistenzbedingung reguliert. Zusätzlich integrieren wir einen weiteren Tiefenkopf, um die Robustheit des vorgeschlagenen Ansatzes zu verbessern. Um die Stärken beider Kopfkomponenten voll auszunutzen, entwickeln wir ein effektives, kontrastives iteratives Verbesserungsmodul, das die Tiefe komplementär basierend auf der Unsicherheit der Tiefenschätzung verfeinert. Umfangreiche Experimente zeigen, dass die vorgeschlagene Methode die bisherigen State-of-the-Art-Verfahren auf den Datensätzen NYU-Depth-v2, KITTI und SUN RGB-D übertrifft. Insbesondere erreicht sie bei der Online-Benchmark-Platzierung für die Tiefenschätzung auf KITTI den ersten Rang unter allen eingereichten Methoden zum Zeitpunkt der Einreichung.