11일 전
컨텐츠 인식형 비지도 딥 호모지어 추정
Jirong Zhang, Chuan Wang, Shuaicheng Liu, Lanpeng Jia, Nianjin Ye, Jue Wang, Ji Zhou, Jian Sun

초록
호모지네이션 추정은 다양한 응용 분야에서 기초적인 이미지 정렬 방법이다. 일반적으로 희소 특징점들을 추출하고 매칭하는 방식으로 수행되며, 저조도 또는 저텍스처 이미지에서는 오류 발생이 빈번하다. 한편 기존의 딥 호모지네이션 접근 방식은 감독 학습을 위해 합성 이미지를 사용하거나, 비감독 학습을 위해 항공 이미지만을 활용하는 등, 실제 응용 환경에서의 깊이 차이와 움직이는 객체를 다루는 중요성을 간과해왔다. 이러한 문제를 해결하기 위해 본 연구에서는 새로운 아키텍처 설계를 갖춘 비감독 딥 호모지네이션 방법을 제안한다. 기존 방법에서 RANSAC 절차의 정신을 계승하여, 신뢰할 수 있는 영역만을 선택할 수 있도록 이상치 마스크를 특별히 학습한다. 이전 방법이 이미지 콘텐츠를 직접 비교하여 손실을 계산한 것과 달리, 본 연구에서는 학습된 딥 특징에 기반하여 손실을 계산한다. 비감독 학습을 구현하기 위해, 본 네트워크에 특화된 새로운 트리플릿 손실을 제안한다. 제안한 방법의 유효성을 검증하기 위해, 다양한 난이도의 시나리오를 포함하는 새로운 데이터셋을 기반으로 포괄적인 비교 실험을 수행하였다. 실험 결과, 기존의 최첨단 딥 솔루션 및 특징 기반 솔루션을 모두 상회함을 확인할 수 있었다.