HyperAIHyperAI
vor 4 Monaten

Revisiting Single Image Depth Estimation: Toward Higher Resolution Maps with Accurate Object Boundaries Wiederholte Betrachtung der Tiefenschätzung aus einem Bild: Hinweise auf hochaufgelöste Karten mit genauen Objekträndern

Junjie Hu; Mete Ozay; Yan Zhang; Takayuki Okatani
Revisiting Single Image Depth Estimation: Toward Higher Resolution Maps with Accurate Object Boundaries
Wiederholte Betrachtung der Tiefenschätzung aus einem Bild: Hinweise auf hochaufgelöste Karten mit genauen Objekträndern
Abstract

In dieser Arbeit wird das Problem der Tiefenschätzung aus einem einzelnen Bild betrachtet. Die Verwendung von Faltungsneuronalen Netzen (CNNs) hat kürzlich erhebliche Fortschritte in der Forschung zu diesem Problem gebracht. Dennoch leiden die meisten existierenden Methoden unter einem Verlust der räumlichen Auflösung in den geschätzten Tiefenkarten; ein typisches Symptom ist eine verzerrte und unscharfe Rekonstruktion von Objekträndern. In dieser Arbeit schlagen wir zwei Verbesserungen für bestehende Ansätze vor, um eine genauere Schätzung mit dem Fokus auf Tiefenkarten mit höherer räumlicher Auflösung zu erreichen. Erstens geht es um die Strategie zur Fusion von Merkmalen, die auf verschiedenen Skalen extrahiert werden. Dafür schlagen wir eine verbesserte Netzarchitektur vor, die aus vier Modulen besteht: einem Encoder, Decoder, Multiskalen-Merkmal-Fusionsmodul und einem Verfeinerungsmodul. Zweitens betrifft es die Verlustfunktionen, die bei der Schulung zur Messung von Inferenzfehlern verwendet werden. Wir zeigen, dass drei Verlustterme, die Fehler in der Tiefe, den Gradienten und den Oberflächennormalen jeweils messen, sich ergänzend zur Verbesserung der Genauigkeit tragen. Experimentelle Ergebnisse belegen, dass diese beiden Verbesserungen eine höhere Genauigkeit als der aktuelle Stand der Technik erzielen, was durch eine feinere Auflösung bei der Rekonstruktion zum Beispiel kleiner Objekte und Objekträndern gegeben ist.