
要約
本稿では、人間や物体の100以上のキーポイントを同時検出する高速なボトムアップ手法について紹介します。この手法は、人間や物体の姿勢推定とも呼ばれています。私たちは、人間や物体に属するすべてのキーポイント(姿勢)をグラフとしてモデル化し、コミュニティ検出から得られる洞察を利用してキーポイントの独立性を定量的に評価します。さらに、グラフ中心性指標を使用して、姿勢の異なる部分に学習重みを割り当てます。提案した指標は、キーポイントが近傍とどれだけ密接に結びついているかを定量的に測定します。実験結果は、顔、手、足などの細かいキーポイントアノテーションを持つ133個のキーポイントで、当手法がこれまでの人間姿勢推定手法全てを上回ることを示しています。また、当手法が車両の姿勢推定にも汎化可能であることを確認しました。