
要約
articulated object pose(関節付き物体の姿勢)の学習は、その姿勢が高次元でありながら多くの構造的な制約を持つため、本質的に困難です。既存のほとんどの研究では、このような制約をモデル化せず、姿勢推定の幾何学的妥当性を保証していないため、必要に応じて正しい幾何学形状を回復するための後処理が必要となり、これは煩雑で非最適な方法となります。本研究では、一般的な関節付き物体の姿勢推定のために深層ニューラルネットワーク学習に直接運動学的物体モデルを埋め込む手法を提案します。運動学的関数は、適切にパラメータ化された物体運動変数上に定義され、微分可能であり、ネットワーク訓練における勾配降下法に基づく最適化に使用できます。物体の幾何学的モデルに関する事前知識が完全に活用され、構造の妥当性が保証されます。私たちは玩具の例と3D人間姿勢推定問題において説得力のある実験結果を示します。後者についてはHuman3.6Mデータセットにおいて最先端の結果を達成しました。