
摘要
稳健且精确的视觉定位是许多应用的基础能力,例如自动驾驶、移动机器人或增强现实。然而,这仍然是一个具有挑战性的任务,尤其是在大规模环境和显著外观变化的情况下。现有的最先进方法不仅在这些场景中表现不佳,而且往往对某些实时应用来说资源消耗过大。本文提出了一种基于单一CNN(卷积神经网络)的分层定位方法HF-Net,该方法同时预测局部特征和全局描述符,以实现精确的六自由度(6-DoF)定位。我们利用了从粗到精的定位范式:首先进行全局检索以获得位置假设,然后在这些候选地点内匹配局部特征。这种分层方法显著节省了运行时间,并使我们的系统适用于实时操作。通过利用学习到的描述符,我们的方法在大范围外观变化下表现出卓越的定位鲁棒性,并在两个具有挑战性的大规模定位基准测试中树立了新的最先进水平。