단일 뷰 깊이 추정을 위한 심층 순서 회귀 네트워크

단일 시점 깊이 추정은 3D 장면 기하학을 이해하는 데 중요한 역할을 하지만, 이는 불완전한 문제입니다. 최근의 방법들은 딥 컨볼루션 신경망(DCNNs)에서 이미지 수준 정보와 계층적 특징을 탐색함으로써 상당한 개선을 이루어냈습니다. 이러한 방법들은 깊이 추정을 회귀 문제로 모델링하고, 평균 제곱 오차를 최소화하여 회귀 네트워크를 학습시키지만, 이 과정은 수렴 속도가 느리고 만족스럽지 않은 국소 해를 초래합니다. 또한, 현재의 깊이 추정 네트워크들은 반복적인 공간 풀링 연산을 사용하여 저해상도 특징 맵을 생성합니다. 고해상도 깊이 맵을 얻기 위해서는 스킵 연결 또는 다중 레이어 디컨볼루션 네트워크가 필요하지만, 이는 네트워크 학습을 복잡하게 만들고 많은 계산량을 소모합니다.이러한 문제들을 제거하거나 적어도 크게 줄이기 위해, 우리는 간격 증가 이산화(Spacing-Increasing Discretization, SID) 전략을 도입하여 깊이를 이산화하고 깊이 네트워크 학습을 서열 회귀 문제로 재구성하였습니다. 서열 회귀 손실 함수를 사용하여 네트워크를 학습시킴으로써, 우리의 방법은 훨씬 더 높은 정확도와 동기화된 더 빠른 수렴 속도(faster convergence in synch)를 달성하였습니다. 또한, 우리는 불필요한 공간 풀링을 피하고 병렬로 다중 스케일 정보를 포착하는 다중 스케일 네트워크 구조를 채택하였습니다.본 논문에서 설명된 방법은 KITTI [17], ScanNet [9], Make3D [50], NYU Depth v2 [42] 등 네 가지 어려운 벤치마크에서 최고 수준의 결과를 달성하였으며, 2018년 로버스트 비전 챌린지에서 1등상을 수상하였습니다. 코드는 다음 주소에서 제공됩니다: https://github.com/hufu6371/DORN.