HyperAIHyperAI

Command Palette

Search for a command to run...

LayoutNet: Rekonstruktion der 3D-Raumstruktur aus einem einzigen RGB-Bild

Zou Chuhang Colburn Alex Shan Qi Hoiem Derek

Zusammenfassung

Wir stellen einen Algorithmus zur Vorhersage von Raumlagen aus einer einzigen Bildaufnahme vor, der sich über Panoramabilder und perspektivische Aufnahmen sowie über quaderförmige und allgemeinere Layouts (z. B. L-förmige Räume) generalisiert. Im Gegensatz zu jüngeren Ansätzen arbeitet unsere Methode direkt auf dem Panoramabild, ohne es in perspektivische Ansichten zu zerlegen. Unser Netzwerkarchitektur ähnelt der von RoomNet, wir zeigen jedoch Verbesserungen durch die Bildausrichtung basierend auf Verschwindungspunkten, die Vorhersage mehrerer Layout-Elemente (Ecken, Ränder, Größe und Translation) sowie die Anpassung eines eingeschränkten Manhattan-Layouts an die resultierenden Vorhersagen. Unser Ansatz erzielt in Bezug auf Geschwindigkeit und Genauigkeit vergleichbare Ergebnisse mit anderen Verfahren für Panoramabilder, erreicht unter den besten Genauigkeitswerten für perspektivische Aufnahmen und ist in der Lage, sowohl quaderförmige als auch allgemeinere Manhattan-Layouts zu verarbeiten.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp