2달 전
각 부분이 중요하다: 지역 패턴이 다중 시점 지오로케이션을 지원한다
Wang, Tingyu ; Zheng, Zhedong ; Yan, Chenggang ; Zhang, Jiyong ; Sun, Yaoqi ; Zheng, Bolun ; Yang, Yi

초록
다른 플랫폼에서 같은 지리적 대상의 이미지를 식별하는 것을 크로스 뷰 지오로케이션(Cross-view geo-localization)이라고 합니다. 예를 들어, 드론 시점 카메라와 위성 등에서 촬영된 이미지가 해당합니다. 극단적인 시점 변화로 인한 큰 시각적 차이 때문에 이는 매우 어려운 문제입니다. 기존 방법들은 일반적으로 이미지 중심부의 지리적 대상의 세부 특징을 추출하는 데 집중하지만, 주변 영역의 맥락 정보를 과소평가합니다. 본 연구에서는 주변 영역을 보조 정보로 활용하여 지오로케이션에 대한 차별화된 단서를 풍부하게 만들 수 있다는 논점을 제시합니다. 구체적으로, 맥락 정보를 end-to-end 방식으로 활용할 수 있는 간단하면서도 효과적인 딥 뉴럴 네트워크인 로컬 패턴 네트워크(Local Pattern Network, LPN)를 소개합니다. 추가적인 부분 추정기(part estimators) 없이 LPN은 사각링 구조의 특징 분할 전략을 채택하여 이미지 중심으로부터의 거리에 따라 주의(attention)를 제공합니다. 이는 부분 매칭을 용이하게 하고 부분별 표현 학습을 가능하게 합니다. 사각링 분할 설계 덕분에 제안된 LPN은 회전 변화에 대해 좋은 확장성을 가지고 있으며, University-1652, CVUSA 및 CVACT라는 세 가지 주요 벤치마크에서 경쟁력 있는 결과를 달성하였습니다. 또한, 제안된 LPN이 다른 프레임워크에 쉽게 통합되어 성능 향상을 더욱 도모할 수 있음을 보여주었습니다.