HyperAIHyperAI

Command Palette

Search for a command to run...

Zum Verständnis von Szenen: Unüberwachte monokulare Tiefenschätzung mit semantikbewusster Darstellung

Yu-Chiang Frank Wang Yen-Cheng Liu Alexander H. Liu Po-Yi Chen

Zusammenfassung

Die monokulare Tiefenschätzung ist eine herausfordernde Aufgabe im Bereich der Szenenverstehens, deren Ziel darin besteht, geometrische Eigenschaften des dreidimensionalen Raums aus zweidimensionalen Bildern abzuleiten. Aufgrund des Fehlens von RGB-Tiefen-Bildpaaren zielen unsupervisierte Lernmethoden darauf ab, Tiefeninformationen durch alternative Supervision, beispielsweise mittels Stereo-Paaren, zu erlangen. Allerdings modellieren die meisten bestehenden Ansätze die geometrische Struktur von Objekten nicht adäquat, was im Allgemeinen darauf zurückzuführen ist, dass während des Trainings ausschließlich pixelbasierte Zielfunktionen verwendet werden. In diesem Artikel stellen wir SceneNet vor, um diese Einschränkung durch die Nutzung semantischer Erkenntnisse aus der Segmentierung zu überwinden. Darüber hinaus ist unser vorgeschlagener Ansatz in der Lage, tiefensensitiv regionenbewusste Schätzungen durchzuführen, indem die Semantik-Konsistenz zwischen Stereo-Paaren erzwungen wird. In unseren Experimenten bestätigen wir qualitativ und quantitativ die Wirksamkeit und Robustheit unseres Modells, das gegenüber den aktuellen Stand der Technik vergleichbare oder sogar bessere Ergebnisse erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Zum Verständnis von Szenen: Unüberwachte monokulare Tiefenschätzung mit semantikbewusster Darstellung | Paper | HyperAI