18日前
モノクロム3次元人体ポーズ推定における弱い透視の超越
Imry Kissos, Lior Fritz, Matan Goldman, Omer Meir, Eduard Oks, Mark Kliger

要約
単眼動画からスキン付き多人物線形(SMPL)モデルを用いて3次元関節の位置および向きを予測するタスクについて検討する。まず、市販のポーズ推定アルゴリズムを用いて2次元関節位置を推定する。その後、SPINアルゴリズムを用い、深層回帰ニューラルネットワークから初期のボディポーズ、形状、カメラパラメータを推定する。次に、これらの初期パラメータを入力として、SMPLifyアルゴリズムに従い、SMPLモデルから推定された3次元関節位置が2次元関節位置と一致するように最適化を行う。このアルゴリズムでは、3次元関節を2次元画像平面に投影するステップが含まれる。従来の手法では、弱い透視仮定に基づき、任意の焦点距離を用いることが一般的である。3Dポーズイン・ザ・ワイルド(3DPW)データセットを用いた実験により、正しいカメラ中心と近似的な焦点距離を用いた完全な透視投影を採用することで、優れた結果が得られることを示した。本アルゴリズムは3DPWチャレンジにおいて優勝エントリとなり、関節向き精度で第一位を達成した。