16日前

RNNPose:堅牢な対応フィールド推定とポーズ最適化を用いた再帰的6-DoFオブジェクトポーズの精緻化

Yan Xu, Kwan-Yee Lin, Guofeng Zhang, Xiaogang Wang, Hongsheng Li
RNNPose:堅牢な対応フィールド推定とポーズ最適化を用いた再帰的6-DoFオブジェクトポーズの精緻化
要約

単眼画像からの6自由度(6-DoF)オブジェクト姿勢推定は困難な課題であり、高精度な推定を行うためには一般的に後処理による精査(post-refinement)プロセスが必要となる。本論文では、誤った初期姿勢や遮蔽(occlusion)に対して頑健なオブジェクト姿勢精査を実現するため、再帰型ニューラルネットワーク(RNN)に基づくフレームワークを提案する。再帰的反復処理において、オブジェクト姿勢の精査は、レンダリング画像と観測画像間の対応領域(correspondence field)を推定することで、非線形最小二乗問題として定式化される。この問題は、微分可能(differentiable)なレーベンバーグ・マーカート(Levenberg-Marquardt: LM)アルゴリズムにより解かれ、エンド・ツー・エンドでの学習が可能となる。各反復ステップにおいて、対応領域の推定と姿勢の精査を交互に実行することで、オブジェクトの正確な姿勢を回復する。さらに、遮蔽に対する耐性を向上させるために、3Dモデルと観測2D画像の学習された記述子(descriptor)に基づく一貫性検証機構を導入し、姿勢最適化の過程で信頼性の低い対応を低重み化する。LINEMOD、Occlusion-LINEMOD、YCB-Videoの各データセットにおける広範な実験により、本手法の有効性が検証され、最先端の性能を達成することが示された。