2달 전
자기 감독 단일 카메라 깊이 추정 연구
Clément Godard; Oisin Mac Aodha; Michael Firman; Gabriel Brostow

초록
픽셀별 지상 진리 깊이 데이터를 대규모로 획득하는 것은 어려운 문제입니다. 이러한 제한을 극복하기 위해, 단일 카메라 깊이 추정을 수행하기 위한 모델 훈련에 있어서 자기 감독 학습(self-supervised learning)이 유망한 대안으로 부각되었습니다. 본 논문에서는 경쟁적인 자기 감독 방법들보다 양적 및 질적으로 개선된 깊이 맵을 생성하는 일련의 개선 사항을 제안합니다.자기 감독 단일 카메라 훈련에 대한 연구는 일반적으로 점점 더 복잡한 아키텍처, 손실 함수, 그리고 이미지 형성 모델을 탐구하며, 최근에는 완전히 감독된 방법(fully-supervised methods)과의 차이를 줄이는 데 기여했습니다. 우리는 놀랍게도 간단한 모델과 관련 설계 선택들이 우수한 예측 결과를 이끌어낸다는 것을 보여줍니다. 특히, (i) 오clusion을 견디는 데 강건하게 설계된 최소 재투영 손실(minimum reprojection loss), (ii) 시각적 아티팩트를 줄이는 전체 해상도 다중 스케일 샘플링 방법(full-resolution multi-scale sampling method), (iii) 카메라 운동 가정을 위반하는 훈련 픽셀들을 무시하기 위한 자동 마스킹 손실(automasking loss) 등을 제안합니다. 각 구성 요소의 독립적인 효과를 입증하고, KITTI 벤치마크에서 고품질의 최신 결과를 보여줍니다.