
要約
堅牢で正確な視覚定位は、自動運転、モバイルロボティクス、拡張現実など多くの応用分野において基本的な能力です。しかし、大規模な環境や大幅な外観変化が存在する場合、依然として困難な課題となっています。最先端の手法はこのようなシナリオに苦戦するだけでなく、特定のリアルタイム応用ではリソースが多すぎることがしばしばあります。本論文では、HF-Netという階層的な定位アプローチを提案します。これは単一のCNN(畳み込みニューラルネットワーク)に基づいており、局所特徴量と全体記述子を同時に予測することで正確な6自由度定位を実現します。我々は粗い位置から細かい位置への定位パラダイムを利用しています:まず全体的な検索を行い、位置仮説を得た後で、候補地点内の局所特徴量をマッチングします。この階層的なアプローチにより、大幅な実行時間の節約が可能となり、システムはリアルタイム操作に適しています。学習された記述子を活用することで、当手法は外観の大規模変動に対する卓越した定位堅牢性を達成し、大規模定位の2つの挑戦的なベンチマークで新しい最先端の成果を示しています。注:「6-DoF」は「6自由度」(ろくじゆうど)と訳しました。「6自由度」は日本語でも一般的に使用される表現です。