3D-Raumlayout-Schätzung aus einem Kubemap einer Panoramabildgebung mittels tiefen Manhattan-Hough-Transformationsverfahrens

Signifikante geometrische Strukturen können durch globale Drahtgitter kompakt beschrieben werden, wenn es um die Schätzung der 3D-Raumstruktur aus einem einzelnen Panoramabild geht. Auf dieser Beobachtung basierend präsentieren wir einen alternativen Ansatz zur Schätzung von Wänden im 3D-Raum, indem wir langreichweitige geometrische Muster in einem lernfähigen Hough-Transformationsblock modellieren. Wir transformieren das Bildmerkmal von einem Kubusseitenfeld in den Hough-Raum einer Manhattan-Welt und kartieren das Merkmal direkt auf die geometrische Ausgabe ab. Die Faltungsschichten lernen nicht nur lokale gradientenartige Linienmerkmale, sondern nutzen auch globale Informationen, um mit einer einfachen Netzwerkstruktur erfolgreich verdeckte Wände vorherzusagen. Im Gegensatz zu den meisten früheren Arbeiten werden die Vorhersagen einzeln auf jedem Kubusseitenfeld durchgeführt und anschließend zusammengefügt, um die Raumstrukturschätzung zu erhalten. Experimentelle Ergebnisse zeigen, dass wir vergleichbare Ergebnisse mit den neuesten Stand der Technik in Bezug auf Vorhersagegenauigkeit und Leistung erzielen. Der Quellcode ist unter https://github.com/Starrah/DMH-Net verfügbar.