16일 전
AtLoc: 주의 기반 카메라 위치 결정
Bing Wang, Changhao Chen, Chris Xiaoxuan Lu, Peijun Zhao, Niki Trigoni, Andrew Markham

초록
딥러닝은 카메라 위치 추정 분야에서 놀라운 성과를 거두었지만, 현재의 단일 이미지 기반 기법은 일반적으로 견고성이 부족하여 큰 이상치(outlier)가 발생하는 문제가 있다. 이 문제는 일정 정도 순차적(다중 이미지) 또는 기하학적 제약을 활용한 접근법을 통해 해결되어 왔으며, 이러한 방법들은 동적 객체나 조명 조건과 같은 요소를 학습 과정에서 거부함으로써 더 나은 성능을 달성할 수 있다. 본 연구에서는 주목(attention) 기법을 활용하여 네트워크가 더 기하학적으로 견고한 객체와 특징에 집중하도록 유도할 수 있음을 보여준다. 이로 인해 단일 이미지만을 입력으로 사용함에도 불구하고 일반 벤치마크에서 최신 기술 수준의 성능을 달성할 수 있다. 공개된 실내 및 실외 데이터셋을 활용한 광범위한 실험 결과를 통해 본 연구의 효과를 입증하였다. 또한 시각화된 샐런시 맵(saliency map)을 통해 네트워크가 어떻게 동적 객체를 효과적으로 거부하는지를 분석하였으며, 이는 전반적인 카메라 자세 회귀 성능의 향상으로 이어짐을 보였다. 소스 코드는 다음 주소에서 확인할 수 있다: https://github.com/BingCS/AtLoc.