
초록
우리는 단일 카메라 영상에서 측정된 단안 깊이, 광학 흐름 및 자기 운동을 추정하기 위한 GeoNet라는 공동 비지도 학습 프레임워크를 제안합니다. 이 세 가지 구성 요소는 3D 장면 기하학의 특성에 의해 결합되며, 우리의 프레임워크는 이를 끝까지 연결하여 공동으로 학습합니다. 구체적으로, 개별 모듈의 예측 결과 간의 기하학적 관계가 추출되어 이미지 재구성 손실로 결합되며, 정적과 동적인 장면 부분을 별도로 고려합니다. 또한, 우리는 아웃라이어와 비램베르트 영역에 대한 강건성을 높이기 위해 적응형 기하학적 일관성 손실을 제안하며, 이는 오clusion(oclusion)과 텍스처 애매함을 효과적으로 해결합니다. KITTI 주행 데이터셋에서의 실험 결과, 우리의 방식은 세 가지 작업 모두에서 최고 수준의 성능을 달성하였으며, 이전 비지도 방법보다 우수하고 지도 방법과 유사한 성능을 보였습니다.