2달 전
기하학적 인식을 활용한 단일 뷰 깊이 추정을 위한 대칭 도메인 적응
Shanshan Zhao; Huan Fu; Mingming Gong; Dacheng Tao

초록
감독된 깊이 추정은 고급 딥 네트워크 아키텍처 덕분에 높은 정확도를 달성하였습니다. 그러나 실제 깊이 라벨을 얻는 것이 어려운데다가, 최근의 방법들은 비감독 신호를 활용하여 비감독 방식으로 깊이 추정 네트워크를 학습하려고 노력하고 있습니다. 이러한 방법들은 효과적이지만 실제 라벨보다 신뢰성이 낮습니다. 이 문제를 해결하기 위한 새로운 접근 방식은 도메인 적응 기술을 통해 합성 이미지의 실제 깊이 라벨로부터 지식을 전송하는 것입니다. 하지만 이러한 접근 방식들은 대상 도메인(즉, 실제 데이터)의 자연 이미지에서 특정 기하학적 구조가 중요한 역할을 한다는 점을 간과하고 있습니다. 이 관찰 결과에 착안하여, 우리는 합성 데이터의 라벨과 실제 데이터의 극점 기하학(Epipolar Geometry)을 동시에 활용하는 기하학적 인식 도메인 적응 프레임워크(Geometry-Aware Symmetric Domain Adaptation, GASDA)를 제안합니다. 또한, 두 개의 이미지 스타일 변환기와 깊이 추정기를 엔드투엔드 네트워크에서 대칭적으로 훈련함으로써 우리의 모델은 더 나은 이미지 스타일 전송을 실현하고 고품질의 깊이 맵을 생성합니다. 실험 결과는 우리 제안 방법의 유효성을 입증하며 최신 연구들과 비교 가능한 성능을 보여줍니다. 코드는 다음과 같은 주소에서 공개될 예정입니다: https://github.com/sshan-zhao/GASDA.