
要約
都市地域におけるクロスビュー地理位置特定は、現在のデータセットや手法において地理空間的な構造が不足しているため、部分的に困難を伴っています。本研究では、グラフ表現を利用することで局所観測のシーケンスと目標地点の接続性をモデル化することを提案します。グラフとしてモデリングすることで、新しいパラメータ設定によるサンプリングにより未見のシーケンスを生成することが可能になります。この新しく利用可能な情報を活用するために、我々はGNN(グラフニューラルネットワーク)ベースのアーキテクチャを提案し、空間的に強固な埋め込みを生成し、単独画像の埋め込みとの識別性を向上させます。SpaGBOLについて概説し、3つの新たな貢献点を紹介します。1) クロスビュー地理位置特定向けに初めてグラフ構造を持つデータセットを開発しました。各ノードに対して複数のストリートビュー画像が含まれており、汎化性能の向上に寄与します。2) GNNsを問題に導入し、初めてノード間距離と特徴類似度の相関関係を利用するシステムを開発しました。3) グラフ表現の独自性を利用して、近傍方位に基づく革新的な検索フィルタリング手法を開発しました。SpaGBOLは未見テストグラフにおいて最先端の精度を達成しており、従来技術に対する相対的なTop-1検索精度改善率は11%であり、Bearing Vector Matching(方位ベクトルマッチング)によるフィルタリングを行った場合、SpaGBOLデータセット上で50%となっています。