2달 전

자기 감독 단일 카메라 깊이 추정 연구

Clément Godard; Oisin Mac Aodha; Michael Firman; Gabriel Brostow
자기 감독 단일 카메라 깊이 추정 연구
초록

픽셀별 지상 진리 깊이 데이터를 대규모로 획득하는 것은 어려운 문제입니다. 이러한 제한을 극복하기 위해, 단일 카메라 깊이 추정을 수행하기 위한 모델 훈련에 있어서 자기 감독 학습(self-supervised learning)이 유망한 대안으로 부각되었습니다. 본 논문에서는 경쟁적인 자기 감독 방법들보다 양적 및 질적으로 개선된 깊이 맵을 생성하는 일련의 개선 사항을 제안합니다.자기 감독 단일 카메라 훈련에 대한 연구는 일반적으로 점점 더 복잡한 아키텍처, 손실 함수, 그리고 이미지 형성 모델을 탐구하며, 최근에는 완전히 감독된 방법(fully-supervised methods)과의 차이를 줄이는 데 기여했습니다. 우리는 놀랍게도 간단한 모델과 관련 설계 선택들이 우수한 예측 결과를 이끌어낸다는 것을 보여줍니다. 특히, (i) 오clusion을 견디는 데 강건하게 설계된 최소 재투영 손실(minimum reprojection loss), (ii) 시각적 아티팩트를 줄이는 전체 해상도 다중 스케일 샘플링 방법(full-resolution multi-scale sampling method), (iii) 카메라 운동 가정을 위반하는 훈련 픽셀들을 무시하기 위한 자동 마스킹 손실(automasking loss) 등을 제안합니다. 각 구성 요소의 독립적인 효과를 입증하고, KITTI 벤치마크에서 고품질의 최신 결과를 보여줍니다.

자기 감독 단일 카메라 깊이 추정 연구 | 최신 연구 논문 | HyperAI초신경