11日前
CoordiNet:信頼性のある車両定位を実現する不確実性を考慮したポーズ回帰器
Arthur Moreau, Nathan Piasco, Dzmitry Tsishkou, Bogdan Stanciulescu, Arnaud de La Fortelle

要約
本稿では、ロボティクスおよび自律走行車両への応用を目的として、ニューラルネットワークを用いた視覚ベースのカメラ再局所化について検討する。本研究の提案手法は、単一の画像から直接カメラのポーズ(3次元並進および3次元回転)を予測するCNNベースのアルゴリズムであり、同時にポーズに対する不確実性推定も提供する。ポーズと不確実性は同一の損失関数により同時に学習され、テスト時に拡張カルマンフィルタ(EKF)を用いて融合される。さらに、シーンの幾何構造の一部を組み込むことを目的として、新しい完全畳み込み型アーキテクチャであるCoordiNetを提案する。本フレームワークは、現在利用可能な最大規模のベンチマークであるOxford RobotCarデータセットにおいて、従来の最良手法の19メートルから改善し、平均誤差8メートルを達成した。また、リアルタイム(18fps)での大型シーンにおける車両局所化性能についても検証した。この設定では、構造ベースの手法は大規模なデータベースを必要とするが、本手法が信頼性の高い代替手段となり得ることを示し、混雑した都市部における1.9kmのループ走行において、中央誤差29cmを達成した。