
초록
우리는 실내 360도 파노라마의 전반적인 이해를 위해 잠재적 수평 특성(Latent Horizontal Feature, LHFeat)을 활용한 다목적이고 효율적인 프레임워크인 HoHoNet을 제시합니다. 컴팩트한 LHFeat은 수직 방향으로 특성을 평탄화하여 방 구조 재구성에서 열별 모달리티(per-column modality)를 모델링하는 데 성공을 거두었습니다. HoHoNet은 두 가지 중요한 측면에서 발전하였습니다. 첫째, 딥 아키텍처가 개선되어 더 빠르게 실행되면서 정확도가 향상되었습니다. 둘째, 새로운 수평-밀집 모듈(horizon-to-dense module)을 제안하여 열별 출력 형태 제약을 완화하고, LHFeat에서 픽셀별 밀집 예측(per-pixel dense prediction)이 가능하도록 하였습니다.HoHoNet은 빠릅니다: 고해상도 $512 \times 1024$ 파노라마에서 밀집 모달리티를 모델링할 때 ResNet-50 백본과 ResNet-34 백본을 각각 사용하여 52 FPS와 110 FPS로 실행됩니다. 또한 HoHoNet은 정확합니다. 레이아웃 추정 및 의미 분할 작업에서 HoHoNet은 현재 최신 기술(state-of-the-art)과 비슷한 결과를 달성하였습니다. 밀집 깊이 추정 작업에서는 HoHoNet이 이전 연구보다 크게 우수한 성능을 보여주었습니다.