
초록
최근 연구에서는 스테레오 이미지 쌍에서 깊이 추정을 컨볼루션 신경망(CNN)을 사용하여 해결할 수 있는 지도 학습 과제로 정식화할 수 있음을 보여주었습니다. 그러나 현재의 아키텍처는 패치 기반의 시아메즈 네트워크에 의존하고 있어, 미해결 지역에서 대응점을 찾기 위한 문맥 정보를 활용하는 방법이 부족합니다. 이 문제를 해결하기 위해, 우리는 두 가지 주요 모듈인 공간 피라미드 풀링과 3D CNN으로 구성된 피라미드 스테레오 매칭 네트워크(PSMNet)를 제안합니다. 공간 피라미드 풀링 모듈은 다양한 크기와 위치에서 문맥을 집계하여 전역 문맥 정보의 용량을 활용합니다. 3D CNN은 중간 감독과 함께 여러 개의 아워글래스 네트워크를 쌓아서 비용 볼륨을 규제하는 방법을 학습합니다. 제안된 접근법은 여러 벤치마크 데이터셋에서 평가되었습니다. 우리의 방법은 2018년 3월 18일 이전까지 KITTI 2012 및 2015 리더보드에서 1위를 차지했습니다. PSMNet의 코드는 다음 링크에서 확인할 수 있습니다: https://github.com/JiaRenChang/PSMNet.