2달 전

전 세계를 80 단계로: 전역 시각 지리위치 추정의 생성적 접근법

Nicolas Dufour, David Picard, Vicky Kalogeiton, Loic Landrieu
전 세계를 80 단계로: 전역 시각 지리위치 추정의 생성적 접근법
초록

전 세계 시각적 지리위치 추정은 이미지가 지구 어디에서 촬영되었는지를 예측합니다. 이미지는 정확히 위치를 특정할 수 있는 정도에 따라 다양하므로 이 작업은 본질적으로 상당한 불확실성을 포함합니다. 그러나 기존 접근 방식들은 결정론적이며 이 부분을 간과하고 있습니다. 본 논문에서는 전통적인 지리위치 추정과 현대적 생성 방법 사이의 격차를 좁히는 것을 목표로 합니다. 우리는 확산과 리만 유동 일치(Riemannian flow matching) 기반의 첫 번째 생성적 지리위치 추정 접근 방식을 제안하며, 이 과정에서 노이즈 제거가 직접 지구 표면에서 이루어집니다. 우리의 모델은 OpenStreetView-5M, YFCC-100M, iNat21 세 가지 시각적 지리위치 벤치마크에서 최고 수준의 성능을 달성하였습니다. 또한, 우리는 모든 가능한 위치에 대한 확률 분포를 예측하는 대신 단일 점을 예측하는 확률적 시각적 지리위치 추정 작업을 소개합니다. 이 작업에 대해 새로운 평가 척도와 기준 모델을 도입하여, 확산 기반 접근 방식의 장점을 보여주었습니다. 코드와 모델은 공개될 예정입니다.

전 세계를 80 단계로: 전역 시각 지리위치 추정의 생성적 접근법 | 최신 연구 논문 | HyperAI초신경