
초록
학습 기반 방법들은 단일 이미지에서 깊이 추정 작업에 있어 매우 유망한 결과를 보여주었습니다. 그러나 대부분의 기존 접근 방식은 깊이 예측을 지도 학습 회귀 문제로 취급하기 때문에, 훈련을 위해 대량의 대응되는 실제 깊이 데이터가 필요합니다. 다양한 환경에서 고품질의 깊이 데이터를 단순히 기록하는 것조차도 어려운 문제입니다. 본 논문에서는 이러한 기존 접근 방식을 혁신하여, 훈련 중 명시적인 깊이 데이터 사용을 더 쉽게 얻을 수 있는 이안 입체 영상으로 대체하였습니다.우리는 실제 깊이 데이터가 부족한 상태에서도 단일 이미지 깊이 추정을 수행할 수 있도록 컨볼루션 신경망(CNN)의 새로운 훈련 목표를 제안합니다. 에피폴라 기하학 제약 조건을 활용하여, 이미지 재구성 손실 함수를 통해 디스파리티 이미지를 생성합니다. 우리는 이미지 재구성을 위한 해결책만으로는 저품질의 깊이 이미지를 얻게 된다는 것을 보여주었습니다. 이 문제를 극복하기 위해, 좌우 이미지에 대해 생성된 디스파리티 간의 일관성을 강제하는 새로운 훈련 손실 함수를 제안합니다. 이로 인해 성능과 안정성이 기존 접근 방식보다 크게 향상되었습니다.우리의 방법은 KITTI 주행 데이터셋에서 단일 눈(monocular) 깊이 추정에 있어 최고 수준의 결과를 생성하며, 실제 깊이 데이터로 훈련된 지도 학습 방법들보다 우수한 성능을 보입니다.