4ヶ月前

深層ニューラルネットワークを用いた3次元人間ポーズの構造的予測

Bugra Tekin; Isinsu Katircioglu; Mathieu Salzmann; Vincent Lepetit; Pascal Fua
深層ニューラルネットワークを用いた3次元人間ポーズの構造的予測
要約

最近の単眼3D姿勢推定へのアプローチは、深層学習に大きく依存しています。これらの方法は、画像から直接3D姿勢を回帰する畳み込みニューラルネットワーク(Convolutional Neural Network)を訓練するか、または推論時に高い計算コストがかかる最大余裕構造学習フレームワークを用いて関節間の依存関係をモデル化します。本稿では、単眼画像からの3D人間姿勢の構造予測を行う深層学習回帰アーキテクチャを提案します。このアーキテクチャは、過剰完備自己符号化器(overcomplete auto-encoder)を使用して高次元の潜在姿勢表現を学習し、関節間の依存関係を考慮します。我々は実験を通じて、提案手法が構造保存と予測精度の両面で最先端の手法を超えることを示しました。