11日前

3Dピクチャリカル構造の再検討:複数人のポーズ推定

{Slobodan Ilic, Mykhaylo Andriluka, Vasileios Belagiannis, Nassir Navab, Sikandar Amin, Bernt Schiele}
要約

複数視点からの複数人の3次元姿勢推定問題に取り組む。単一人物から複数人物への拡張、および2次元から3次元空間への移行は、状態空間が著しく拡大し、隠蔽(occlusion)や視点間の曖昧性(across-view ambiguities)が生じるため、特に人物のIDが事前に分かっていない場合に困難である。これらの課題に対処するため、まず各カメラ視点で部位検出器によって得られた対応する部位ペアを三角測量することで、状態空間を縮小する。三角測量後に生じる複数人の部位の誤当りや混同、および誤検出(false positive)に起因する曖昧性を解消するために、3次元ピクトリアル構造(3D Pictorial Structures, 3DPS)モデルを導入する。本モデルは多視点単一項ポテンシャル(multi-view unary potentials)に基づき、事前モデルを2項および3項ポテンシャル関数に統合している。各ポテンシャルの影響を適切にバランスさせるために、構造化SVM(Structured SVM, SSVM)を用いてモデルパラメータを学習する。本モデルは単一人物および複数人物の姿勢推定の両方に適用可能な汎用的構造である。単一および複数人物の姿勢推定におけるモデルの有効性を検証するため、4つの異なるデータセットを用いて評価を行う。まず、各ポテンシャルの寄与を分析し、既存の関連研究と比較することで、本手法が優れた性能を示すことを実証する。

3Dピクチャリカル構造の再検討:複数人のポーズ推定 | 最新論文 | HyperAI超神経