Command Palette
Search for a command to run...
モノクローム3Dポーズ推定のためのポーズ文法学習
モノクローム3Dポーズ推定のためのポーズ文法学習
Song-Chun Zhu Yuanlu Xu Wenguan Wang Jianwen Xie Xiaobai Liu
概要
本稿では、単眼RGB画像から3次元人体ポーズを推定する問題に取り組むため、ポーズ文法(pose grammar)を提案する。本モデルは、推定された2次元ポーズを入力として受け取り、一般化された2次元-3次元マッピング関数を学習し、それを用いて3次元ポーズを推定する。提案するモデルは、ポーズに整合した特徴を効率的に捉えるベースネットワークと、人体構造に関する知識(すなわち運動学、対称性、運動連携など)を明示的に組み込むための階層的双方向RNN(BRNN)から構成されている。この構造により、人体ポーズに高レベルな制約を強制することが可能となる。学習段階では、外見の変動に対するモデルのロバスト性および視点間一般化能力をさらに向上させるため、データ拡張アルゴリズムを構築した。我々は、公開の3次元人体ポーズベンチマーク上で提案手法を検証し、異なる手法の一般化能力を検証するため、視点間設定を想定した新しい評価プロトコルを提案した。実証的に、多数の最先端手法がこの設定下で困難を抱えるのに対し、本手法はそのような課題を適切に処理できることを確認した。