16일 전

LLM 기반의 크로스뷰 일관성 어텐션을 이용한 UAV 및 위성 이미지에 대한 새로운 지리적 위치 추정 방법

{Y Zhang, H Li, Y Li, Z Zhang, X Wang, P Zhou, Z Cui}
초록

지오로컬라이제이션은 실외 비행 중 무인 항공기(UAV) 항법을 위한 경도와 위도를 확보하는 데 널리 활용되는 중요한 기술로, 최근 들어 GPS 신호의 간섭 및 차단 가능성으로 인해 간섭에 덜 취약한 이미지 검색 기반 방법에 대한 관심이 크게 증가하고 있다. 다양한 시점에서 촬영된 GPS 태그가 부착된 드론 이미지와 사전 확보된 위성 이미지를 기반으로 쿼리하여 UAV 및 위성의 지오로컬라이제이션을 수행할 수 있다. 본 논문에서는 이미지 변환 기술을 활용하여 UAV와 위성 간의 다각도 지오로컬라이제이션 정보를 추출한다. 또한, 기존의 다단계 학습 기법보다 높은 정확도를 달성하기 위해, 다각도 특징 추출과 이미지 검색을 동시에 수행하는 단일 단계 학습 방법을 최초로 제안한다. 또한, 긍정 샘플과 부정 샘플에 대한 제약이 부족할 경우 모델 파라미터가 국소 최적해에 갇히는 문제를 방지하기 위해 새로운 조각별 소프트 마진 트리플릿 손실 함수를 설계하였다. 실험 결과, 제안된 손실 함수는 이미지 검색 정확도를 향상시키고 더 우수한 수렴 성능을 보임을 입증하였다. 더불어, 이미지 샘플의 비율 불균형 문제를 해결하기 위해 위성 이미지에 대한 새로운 데이터 증강 방법을 제안하였다. 기준 데이터셋인 University-1652에서 제안된 방법은 기존 최고 성능 기법 대비 Recall@1에서 6.67% 향상되고, 평균 정밀도(AP)에서도 6.13% 향상된 최신 기술 수준의 성능을 달성하였다. 모든 코드는 재현 가능성을 높이기 위해 공개될 예정이다.

LLM 기반의 크로스뷰 일관성 어텐션을 이용한 UAV 및 위성 이미지에 대한 새로운 지리적 위치 추정 방법 | 최신 연구 논문 | HyperAI초신경