HyperAIHyperAI
vor 11 Tagen

Zur praktikablen monokularen Tiefenschätzung im Innenraum

Cho-Ying Wu, Jialiang Wang, Michael Hall, Ulrich Neumann, Shuochen Su
Zur praktikablen monokularen Tiefenschätzung im Innenraum
Abstract

Die meisten vorherigen Methoden zur monokularen Tiefenschätzung ohne Anleitung durch Tiefen-Groundtruth konzentrieren sich auf Fahrszenarien. Wir zeigen, dass solche Ansätze eine schlechte Verallgemeinerungsfähigkeit für unbekannte, komplexe Innenraumszenen aufweisen, in denen Objekte dicht und willkürlich im Nahfeld angeordnet sind. Um eine höhere Robustheit zu erreichen, schlagen wir einen Struktur-Distillation-Ansatz vor, um Kenntnisse aus einem kommerziell erhältlichen relativen Tiefenschätzer zu lernen, der strukturierte, jedoch metrisch unabhängige Tiefeninformationen erzeugt. Durch die Kombination der Struktur-Distillation mit einem Zweig, der Metriken aus der Link-Right-Konsistenz lernt, erreichen wir strukturierte und metrisch korrekte Tiefeninformationen für allgemeine Innenraumszenen und ermöglichen Echtzeit-Inferenzen. Zur Förderung des Lernens und der Evaluation sammeln wir SimSIN, einen aus Simulationen stammenden Datensatz mit Tausenden von Umgebungen, sowie UniSIN, einen Datensatz, der etwa 500 reale Scans von allgemeinen Innenraumszenen enthält. Wir evaluieren unsere Methode sowohl im Sim-to-Real- als auch im Real-to-Real-Szenario und zeigen Verbesserungen sowie positive Wirkung in nachgeschalteten Anwendungen unter Verwendung unserer Tiefenkarten. Diese Arbeit bietet eine umfassende Studie, die Methoden, Daten und Anwendungen umfasst.

Zur praktikablen monokularen Tiefenschätzung im Innenraum | Neueste Forschungsarbeiten | HyperAI