Command Palette
Search for a command to run...
LayoutNet: Rekonstruktion der 3D-Raumstruktur aus einem einzigen RGB-Bild
LayoutNet: Rekonstruktion der 3D-Raumstruktur aus einem einzigen RGB-Bild
Zou Chuhang Colburn Alex Shan Qi Hoiem Derek
Zusammenfassung
Wir stellen einen Algorithmus zur Vorhersage von Raumlagen aus einer einzigen Bildaufnahme vor, der sich über Panoramabilder und perspektivische Aufnahmen sowie über quaderförmige und allgemeinere Layouts (z. B. L-förmige Räume) generalisiert. Im Gegensatz zu jüngeren Ansätzen arbeitet unsere Methode direkt auf dem Panoramabild, ohne es in perspektivische Ansichten zu zerlegen. Unser Netzwerkarchitektur ähnelt der von RoomNet, wir zeigen jedoch Verbesserungen durch die Bildausrichtung basierend auf Verschwindungspunkten, die Vorhersage mehrerer Layout-Elemente (Ecken, Ränder, Größe und Translation) sowie die Anpassung eines eingeschränkten Manhattan-Layouts an die resultierenden Vorhersagen. Unser Ansatz erzielt in Bezug auf Geschwindigkeit und Genauigkeit vergleichbare Ergebnisse mit anderen Verfahren für Panoramabilder, erreicht unter den besten Genauigkeitswerten für perspektivische Aufnahmen und ist in der Lage, sowohl quaderförmige als auch allgemeinere Manhattan-Layouts zu verarbeiten.