2달 전
큰 것에서 작은 것까지: 단일 카메라 깊이 추정을 위한 다중 규모 국부 평면 안내
Jin Han Lee; Myung-Kyu Han; Dong Wook Ko; Il Hong Suh

초록
단일 이미지에서 정확한 깊이를 추정하는 것은 무한히 많은 3D 장면이 동일한 2D 장면으로 투영될 수 있기 때문에 제약 조건이 부족한 문제로 어려움을 겪습니다. 그러나 최근 딥 컨볼루션 신경망을 기반으로 하는 연구들은 타당한 결과를 보여주며 큰 진전을 이루고 있습니다. 컨볼루션 신경망은 일반적으로 두 부분으로 구성되는데, 하나는 밀집된 특징을 추출하기 위한 인코더이고, 다른 하나는 원하는 깊이를 예측하기 위한 디코더입니다. 인코더-디코더 구조에서 반복적인 스트라이드 컨볼루션과 공간 풀링 레이어가 전환 출력의 공간 해상도를 낮추므로, 스킵 연결이나 다중 계층 디컨볼루션 네트워크 등의 여러 기술이 채택되어 원래 해상도를 복원하여 효과적인 밀집 예측을 수행합니다. 본 논문에서는 밀집된 특징을 원하는 깊이 예측으로 더욱 효과적으로 안내하기 위해 디코딩 단계의 여러 단계에 위치한 새로운 로컬 평면 안내 레이어를 활용하는 네트워크 아키텍처를 제안합니다. 우리는 도전적인 벤치마크에서 평가한 결과를 통해 제안된 방법이 최신 연구보다 크게 우수함을 보여주며, 또한 제안된 방법의 유효성을 검증하기 위한 감소 연구(ablation study) 결과도 제공합니다.