2ヶ月前
野生環境下的3D人間姿勢推定による敵対的学習
Wei Yang; Wanli Ouyang; Xiaolong Wang; Jimmy Ren; Hongsheng Li; Xiaogang Wang

要約
最近、単眼画像からの3次元ヒューマンポーズ推定において、強力な深層畳み込みニューラルネットワーク(Deep Convolutional Neural Networks: DCNNs)の発展により著しい進歩が達成されました。しかし、制約のある実験室環境で収集された大規模データセットでの成功にもかかわらず、野生環境の画像に対して3次元ポーズアノテーションを取得することは困難です。したがって、野生環境における3次元ヒューマンポーズ推定は依然として課題となっています。本論文では、完全にアノテーションされたデータセットから学習した3次元ヒューマンポーズ構造を、2次元ポーズアノテーションのみを持つ野生環境の画像に抽出するための敵対的学習フレームワークを提案します。従来のようにポーズ推定結果を制約するハードコーディングルールを定義するのではなく、予測された3次元ポーズと真値との区別を行う新しいマルチソース識別子を設計しました。これにより、野生環境の画像を使用しても人体計測学的に妥当なポーズを生成することが可能になります。また、識別子の性能向上には慎重に設計された情報源が不可欠であることを確認しました。そこで、ボディジョイント間の相対位置と距離を計算する幾何学的記述子を新たに設計し、これを識別子の新たな情報源として用いました。我々の提案する敵対的学習フレームワークと新しい幾何学的記述子の有効性は、広く使用されている公開ベンチマークでの多数の実験を通じて示されています。我々の手法は、従来の最先端手法と比較して大幅に性能を向上させています。