HyperAIHyperAI

Command Palette

Search for a command to run...

SDC-Depth: Semantic Divide-and-Conquer Network für die Monokulare Tiefenschätzung

Huchuan Lu Zhe Lin Oliver Wang Jianming Zhang Lijun Wang

Zusammenfassung

Die monokulare Tiefenschätzung ist ein schlecht gestelltes Problem und hängt daher entscheidend von Szenen-Priorisierungen und Semantik ab. Aufgrund ihrer Komplexität schlagen wir ein tiefes neuronales Netzwerkmodell vor, das auf einem semantischen Divide-and-Conquer-Ansatz basiert. Unser Modell zerlegt eine Szene in semantische Segmente, wie beispielsweise Objektinstanzen und Hintergrund-„Stuff“-Klassen, und schätzt für jedes semantische Segment in einem kanonischen Raum eine skalen- und verschiebungsinvariante Tiefenkarte vor. Semantische Segmente derselben Kategorie teilen sich denselben Tiefendekoder, wodurch die globale Tiefenschätzaufgabe in eine Reihe von kategorie-spezifischen Teilproblemen zerlegt wird, die einfacher zu lernen sind und sich besser auf neue Szenentypen verallgemeinern lassen. Schließlich verbindet unser Modell die einzelnen lokalen Tiefensegmente, indem es deren Skalierung und Verschiebung auf Basis des globalen Kontexts der Bildes vorhersagt. Das Modell wird end-to-end mit einer Multi-Task-Loss-Funktion für Panoptic-Segmentierung und Tiefenschätzung trainiert und kann daher große Panoptic-Segmentierungsdatasets nutzen, um sein semantisches Verständnis zu verbessern. Wir bestätigen die Wirksamkeit unseres Ansatzes und zeigen state-of-the-art-Leistungen auf drei Benchmark-Datensätzen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp