3D-Objekterkennung mit latenten Support-Flächen

Wir entwickeln einen 3D-Objektdetektionsalgorithmus, der latente Stützflächen nutzt, um kontextuelle Beziehungen in Innenräumen zu erfassen. Bestehende 3D-Darstellungen für RGB-D-Bilder erfassen die lokale Form und Erscheinung von Objektkategorien, verfügen jedoch über begrenzte Kapazität, Objekte mit unterschiedlichen visuellen Stilen darzustellen. Die Erkennung kleiner Objekte ist zudem herausfordernd, da der Suchraum in 3D-Szenen sehr groß ist. Wir beobachten jedoch, dass ein Großteil der Formvariation innerhalb von 3D-Objektkategorien durch die Lage einer latenten Stützfläche erklärt werden kann und kleinere Objekte oft von größeren Objekten getragen werden. Daher nutzen wir latente Stützflächen explizit, um die 3D-Erscheinung großer Objekte besser zu modellieren und gleichzeitig kontextuelle Hinweise bereitzustellen, um die Erkennung kleiner Objekte zu verbessern. Wir evaluieren unser Modell anhand von 19 Objektkategorien aus der SUN RGB-D-Datenbank und demonstrieren einen state-of-the-art-Leistungsstand.