HyperAIHyperAI
vor 2 Monaten

HoHoNet: 360°-Innenraum-Holistisches Verständnis mit latenten horizontalen Merkmalen

Sun, Cheng ; Sun, Min ; Chen, Hwann-Tzong
HoHoNet: 360°-Innenraum-Holistisches Verständnis mit latenten horizontalen Merkmalen
Abstract

Wir präsentieren HoHoNet, ein vielseitiges und effizientes Framework für die umfassende Analyse von Indoor-Panoramen mit 360 Grad Winkelansicht unter Verwendung eines Latenten Horizontalen Merkmals (LHFeat). Das kompakte LHFeat glättet die Merkmale in vertikaler Richtung und hat sich bei der Modellierung der Spaltenweise Modalität für Raumlayout-Rekonstruktion als erfolgreich erwiesen. HoHoNet macht Fortschritte in zwei wichtigen Aspekten. Erstens wird die tiefenarchitektur neu gestaltet, um schneller zu laufen und eine verbesserte Genauigkeit zu erzielen. Zweitens schlagen wir ein neues Modul „Horizon-to-Dense“ vor, das die Spaltenweise Ausgabeform-Beschränkung lockert und eine dichte Pixel-basierte Vorhersage aus LHFeat ermöglicht. HoHoNet ist schnell: Es erreicht 52 FPS und 110 FPS mit den Backbones ResNet-50 und ResNet-34 jeweils, um dichte Modalitäten aus einem hochaufgelösten Panorama im Format $512 \times 1024$ zu modellieren. HoHoNet ist auch genau. Bei den Aufgaben der Layout-Schätzung und der semantischen Segmentierung erzielt HoHoNet Ergebnisse, die mit dem aktuellen Stand der Technik vergleichbar sind. Bei der dichten Tiefenschätzung übertrifft HoHoNet alle bisherigen Ansätze deutlich.