16日前

マルチビュー画像からの複数人3Dポーズ推定

{Shohreh Kasaei, Sara Ershadi-Nasab, Esmaeil Sanaei, Erfan Noury}
要約

複数人の3次元ポーズ推定は、非常に困難な課題である。その主な理由は、人のスケールやポーズの大きなばらつき、高速な運動、シーン内に複数人の存在、および遮蔽や断片化によって可視部位の数が任意に変化する点にある。これらの不確実性の一部は、マルチビュー画像を用いることで解決可能である。これは、複数の視点から見ることで、人体部位に関するより多くの証拠が得られるためである。本研究では、マルチビュー画像内の証拠を活用した複数人3次元ポーズ推定の新規手法を提案する。提案手法は、2種類のペアワイズ項を含む完全結合型のペアワイズ条件付き確率場(Pairwise Conditional Random Field)を用いる。第一のペアワイズ項は、関節構造に基づく人体のアーティキュレーテッド構成をもとに、人体関節間の空間的依存関係を表現する。第二のペアワイズ項は、2次元の深層部位検出器の出力に基づく。その後、ループ付き信念伝播(Loopy Belief Propagation)アルゴリズムを用いて近似的な推論が行われる。提案手法は、Campus、Shelf、Utrecht Multi-Person Motionベンチマーク、Human3.6M、KTH Football II、MPII Cookingの各データセット上で評価された。実験結果から、本手法は、正しくポーズを推定する確率および関節位置誤差の平均(mean per joint position error)という指標において、従来の最先端手法と比較して顕著な性能向上を達成していることが示された。

マルチビュー画像からの複数人3Dポーズ推定 | 最新論文 | HyperAI超神経