9일 전
AtlantaNet: 맨해튼 세계 가정을 초월한 단일 360(∘) 이미지로부터 3D 실내 구조 추론하기
{Marco Agus, Giovanni Pintore, Enrico Gobbetti}

초록
단일 패노라마 이미지에서 3차원 실내 구조를 예측하는 새로운 엔드투엔드 접근법을 제안한다. 최근의 최첨단 기술들과 비교할 때, 본 방법은 맨해튼 월드(Manhattan World) 환경에 국한되지 않으며, 직각을 이루지 않거나 곡선 형태를 가진 수직 벽에 의해 둘러싸인 실내 구조—즉, 애틀랜타 월드(Atlanta World) 모델—도 재구성할 수 있다. 본 연구에서 제안하는 방법은 원래 중력에 따라 정렬된 패노라마 이미지를 카메라 위와 아래의 두 수평 평면에 투영한다. 이러한 표현 방식은 실내의 3차원 경계면을 재구성하기 위해 필요한 모든 정보를 바닥 평면 상의 2차원 실내 풋프린트와 실내 높이의 형태로 포함한다. 3차원 구조를 예측하기 위해, 장거리 기하학적 패턴을 포착하기 위해 순환 신경망(RNN)을 활용하고, 도메인 특화된 지식 기반의 맞춤형 훈련 전략을 도입한 인코더-디코더 신경망 아키텍처를 제안한다. 실험 결과, 특히 복잡한 벽 구조나 곡선 형태의 벽 풋프린트를 가진 경우에서 기존 최첨단 기술들을 상회하는 예측 정확도를 보였다.