4ヶ月前
進化的訓練データを用いた単眼深層3次元人間姿勢推定のカスケード処理
Shichao Li; Lei Ke; Kevin Pratama; Yu-Wing Tai; Chi-Keung Tang; Kwang-Ting Cheng

要約
端から端までの深層表現学習は、単眼3Dヒューマンポーズ推定において優れた精度を達成していますが、限られた固定された訓練データでは未見のポーズに対してモデルが失敗する可能性があります。本論文では、以下の特徴を持つ新しいデータ拡張手法を提案します:(1) 2Dから3Dへのネットワークの訓練に大量の訓練データ(800万件以上の有効な3Dヒューマンポーズと対応する2D投影)を合成するためのスケーラビリティを備えています、(2) データセットのバイアスを効果的に軽減することができます。当手法は階層的なヒューマン表現と先行知識に基づくヒューリスティクスを利用して、限られたデータセットを進化させ、未見の3Dヒューマン骨格を合成します。広範な実験により、当手法が最大公衆ベンチマークで最先端の精度を達成し、未見および稀なポーズに対する汎化性能も大幅に向上していることが示されています。コード、事前学習済みモデル、およびツールはこのHTTPS URLで利用可能です。