2ヶ月前

CV-Cities: 全球都市におけるクロスビュー地理位置特定の進展

Huang, Gaoshuang ; Zhou, Yang ; Zhao, Luying ; Gan, Wenjian
CV-Cities: 全球都市におけるクロスビュー地理位置特定の進展
要約

クロスビュー地理位置特定(CVGL)は、地上画像の地理的位置を決定するために衛星画像とマッチングおよび検索を行う技術であり、GNSS制約のあるシナリオにおいて重要な役割を果たします。しかし、このタスクには視点の大幅な違い、位置特定シナリオの複雑さ、そしてグローバルな位置特定の必要性といった大きな課題が存在します。これらの問題に対処するため、私たちはビジョン基盤モデルDINOv2と先進的な特徴量ミキサーを統合した新しいCVGLフレームワークを提案します。当該フレームワークでは対称的なInfoNCE損失関数を導入し、近傍サンプリングと動的類似度サンプリング戦略を取り入れることで、位置特定精度を大幅に向上させています。実験結果は、当該フレームワークが複数の公開データセットや自作データセットで既存手法を超えることを示しています。さらにグローバルスケールでの性能向上を目指して、私たちはグローバルCVGL用の新しいデータセットCV-Citiesを開発しました。CV-Citiesには6大陸にまたがる16都市からなる223,736組の地上-衛星画像ペアと地理位置情報が含まれており、多様な複雑なシナリオをカバーしており、CVGLにとって挑戦的なベンチマークとなっています。CV-Citiesで訓練されたフレームワークは様々なテスト都市で高い位置特定精度を示しており、その強力な国際化と汎化能力が明らかになっています。私たちのデータセットとコードは以下のURLから入手可能です: https://github.com/GaoShuang98/CVCities.

CV-Cities: 全球都市におけるクロスビュー地理位置特定の進展 | 最新論文 | HyperAI超神経