
要約
本稿では、新たな6次元物体ポーズ推定手法であるHybridPoseを提案する。HybridPoseは、入力画像内の異なる幾何情報(キーポイント、エッジベクトル、対称性対応関係など)を表現するためのハイブリッド中間表現を採用している。単一表現(unitary representation)と比較して、本手法のハイブリッド表現は、ある種の予測表現が不正確(例えば遮蔽によって)な場合でも、ポーズ回帰がより多様かつ豊富な特徴を利用できるという利点を持つ。HybridPoseが用いる異なる中間表現は、いずれも同一のシンプルなニューラルネットワークによって予測可能であり、予測された中間表現における外れ値は、ロバストな回帰モジュールによってフィルタリングされる。最先端のポーズ推定手法と比較して、HybridPoseは実行時間および精度において同等の性能を発揮する。例えば、Occlusion Linemodデータセットにおいて、本手法は30 fpsの推定速度を達成しつつ、平均ADD(-S)精度47.5%を実現し、現時点での最先端性能を示している。HybridPoseの実装コードは、https://github.com/chensong1995/HybridPose にて公開されている。