HyperAIHyperAI
vor 16 Tagen

Tiefere Einblicke in die selbstüberwachte monokulare Tiefenschätzung im Innenraum

Chao Fan, Zhenyu Yin, Yue Li, Feiqing Zhang
Tiefere Einblicke in die selbstüberwachte monokulare Tiefenschätzung im Innenraum
Abstract

Die Schätzung der Tiefen aus einer einzigen Kamera mithilfe von Faltungsneuralen Netzen (CNNs) hat in Außenbereichen, insbesondere im Bereich des autonomen Fahrens, beeindruckende Ergebnisse erzielt. Die selbstüberwachte Lernmethode für Tiefenschätzung im Innenraum anhand monokularer Sequenzen stellt jedoch für Forscher erhebliche Herausforderungen dar, hauptsächlich aufgrund zweier zentraler Faktoren: Erstens sind große Bereiche mit geringer Textur charakteristisch, und zweitens weisen die Trainingsdatensätze für Innenräume eine komplexe Eigenbewegung (ego-motion) auf. In dieser Arbeit präsentieren wir eine neue Methode namens IndoorDepth, die zwei zentrale Innovationen umfasst. Zunächst stellen wir eine neuartige photometrische Verlustfunktion vor, die eine verbesserte Strukturähnlichkeitsfunktion (SSIM) nutzt, um die Schwierigkeiten bei der Verarbeitung von Texturarmen Regionen zu überwinden. Darüber hinaus werden mehrere photometrische Verlustfunktionen in verschiedenen Schichten eingesetzt, um ein tieferes Pose-Netzwerk mit zwei Residual-Pose-Blöcken zu trainieren, wodurch die Genauigkeit der Eigenbewegungsschätzung weiter verbessert wird. Eine anschließende Ablationsstudie bestätigt die Wirksamkeit jedes einzelnen Ansatzes. Experimente am NYUv2-Benchmark zeigen, dass unsere Methode IndoorDepth die bisherigen State-of-the-Art-Verfahren deutlich übertrifft. Zudem wird die Generalisierungsfähigkeit unseres Ansatzes anhand des ScanNet-Datensatzes validiert. Der Quellcode ist unter https://github.com/fcntes/IndoorDepth verfügbar.

Tiefere Einblicke in die selbstüberwachte monokulare Tiefenschätzung im Innenraum | Neueste Forschungsarbeiten | HyperAI