16日前
AtLoc:Attentionを用いたカメラローカライゼーション
Bing Wang, Changhao Chen, Chris Xiaoxuan Lu, Peijun Zhao, Niki Trigoni, Andrew Markham

要約
深層学習はカメラ定位において顕著な成果を上げているが、現在の単一画像ベースの手法は一般的に頑健性に欠け、大きな外れ値が発生する傾向にある。この問題の一部は、順次処理(複数画像)や幾何制約を用いるアプローチによって緩和されてきた。これらの手法は動的物体や照明条件を学習的に排除することで、より優れた性能を実現している。本研究では、アテンション機構を活用することで、ネットワークが幾何学的により頑健な物体や特徴に注目するように強制できることを示す。これにより、単一画像を入力として用いるにもかかわらず、一般的なベンチマークにおいて最先端の性能を達成することが可能となる。公開された屋内および屋外データセットを用いた広範な実験により、その有効性が裏付けられている。特に、サリエンシーマップの可視化を通じて、ネットワークが動的物体を効果的に排除するメカニズムを明らかにし、全体的なカメラポーズ推定性能の優位性を示している。ソースコードは以下のURLから公開されている:https://github.com/BingCS/AtLoc。