
지리위치 결정을 위한 시점 간 이미지 매칭은 공중과 지상 시점 사이의 눈에 띄는 시각적 차이로 인해 어려운 문제입니다. 이 방법은 지리참조 이미지를 통해 위치 결정 능력을 제공하여 외부 장치나 비용이 많이 드는 장비의 필요성을 제거합니다. 이는 GNSS가 사용되지 않는 환경에서 에이전트들이 자율적으로 자신의 위치를 파악하고, 탐색하며, 효과적으로 작동하는 능력을 향상시킵니다. 현재 연구에서는 도메인 간 차이를 줄이기 위해 다양한 기술을 사용하고 있습니다. 예를 들어, 공중 이미지에 극좌표 변환을 적용하거나 시점을 합성하는 등의 방법이 있습니다. 그러나 이러한 접근 방식은 일반적으로 360° 시야각을 필요로 하므로 실제 세계에서의 활용성이 제한됩니다.우리는 이러한 한계를 극복하기 위해 BEV-CV라는 새로운 접근 방식을 제안합니다. 이 방법은 두 가지 주요 혁신을 도입하여 시점 간 지리위치 결정의 실제 세계 활용성을 개선하는 것을 목표로 합니다. 첫째, 지상 수준 이미지를 의미론적 조감도(Birds-Eye-View)로 변환한 후 임베딩을 매칭하여 공중 이미지 표현과 직접 비교할 수 있도록 합니다. 둘째, 데이터셋을 실제 응용에 적합한 형식으로 조정합니다. 즉, 차량 방향에 맞춰 정렬된 제한된 시야각(Field-of-View) 이미지를 사용합니다.BEV-CV는 최고 수준의 재현율 정확도를 달성하며, CVUSA와 CVACT 데이터셋의 70° 크롭 이미지에서 각각 23%와 24%의 Top-1 정확도 향상을 보였습니다. 또한, 부동 소수점 연산(Floating Point Operations)을 이전 연구보다 감소시키고 임베딩 차원을 33% 줄여서 계산 요구사항을 낮추었습니다. 이를 통해 더 빠른 위치 결정 능력을 제공할 수 있게 되었습니다.