2달 전
깊이 입체 회귀를 위한 기하학과 문맥의 엔드투엔드 학습
Alex Kendall; Hayk Martirosyan; Saumitro Dasgupta; Peter Henry; Ryan Kennedy; Abraham Bachrach; Adam Bry

초록
우리는 정규화된 스테레오 이미지 쌍에서 디스파리티를 회귀하기 위한 새로운 딥 러닝 아키텍처를 제안합니다. 문제의 기하학적 특성을 활용하여 깊은 특성 표현을 사용해 비용 볼륨을 생성합니다. 이 비용 볼륨 위에서 3차원 합성곱을 통해 문맥 정보를 통합하는 방법을 학습합니다. 제안된 미분 가능한 소프트 argmin 연산을 사용하여 비용 볼륨에서 디스파리티 값을 회귀하며, 이를 통해 추가적인 후처리나 정규화 없이도 서브픽셀 정확도로 전체적으로 우리의 방법을 훈련할 수 있습니다. 우리는 Scene Flow와 KITTI 데이터셋에서 우리의 방법을 평가하였으며, KITTI에서는 경쟁 모델들보다 현저히 빠른 속도로 새로운 최고 성능 벤치마크를 설정하였습니다.