
摘要
在城市区域内的跨视角地理定位具有挑战性,部分原因在于当前数据集和技术中缺乏地理空间结构。我们提出利用图表示来建模局部观察序列和目标位置的连通性。将问题建模为图可以生成以前未见过的序列,通过采样新的参数配置实现。为了充分利用这一新获得的信息,我们提出了一种基于图神经网络(GNN)的架构,该架构能够生成空间上强大的嵌入向量,并提高相对于孤立图像嵌入的区分能力。我们介绍了SpaGBOL系统,提出了三个创新贡献:1)首个用于跨视角地理定位的图结构数据集,每个节点包含多个街景图像以提高泛化能力;2)引入图神经网络解决该问题,开发了首个利用节点邻近性和特征相似性之间相关性的系统;3)利用图表示的独特属性——我们展示了一种基于邻域方位角的新颖检索过滤方法。SpaGBOL在未见过的测试图上实现了最先进的精度,在SpaGBOL数据集上使用方位矢量匹配过滤时,相对之前的最佳技术Top-1检索准确率提高了11%,而使用方位矢量匹配过滤时则提高了50%。