
要約
人間の姿勢推定は行動認識の重要なステップです。本研究では、既存の2D姿勢/関節検出器と連携して単一画像から3D人間の姿勢を推定する方法を提案します。3D姿勢推定は、深度情報が不足しているため、複数の3D姿勢が投影後に同じ2D姿勢に対応する可能性があるという点で困難です。さらに、現在の2D姿勢推定器は一般的に精度が低く、これが3D推定における誤差を引き起こす可能性があります。これらの課題に対処するために、以下の3つの手法を採用しました:(i) 3D人間骨格から学習した疎な基底集合の線形結合として3D姿勢を表現します。(ii) 肢体長制約を強制することで、人間工学的に不適切な骨格を排除します。(iii) 3D姿勢の投影と対応する2D検出との$L_1$-ノルム誤差を最小化することにより3D姿勢を推定します。$L_1$-ノルム損失項は、2D関節位置推定の不正確さに対して堅牢です。最適化問題を効率的に解くために、交代方向法(Alternating Direction Method, ADM)を使用しています。我々のアプローチは、3つのベンチマークデータセットにおいて現行の最先端技術を超える性能を示しています。