
要約
単眼カメラによる野外環境での3次元人間姿勢推定における主要な課題の一つは、正確な3次元姿勢が注釈された制約のない画像を含む訓練データの取得です。本論文では、この課題に対処するために、3次元注釈を必要とせず、ラベルの付いていない多視点データから3次元姿勢を推定する弱教師付きアプローチを提案します。多視点データは野外環境で容易に取得できるため、このアプローチは実用的です。我々は、多視点一貫性を利用した弱教師付き学習を行う新しいエンドツーエンド学習フレームワークを提案します。多視点一貫性は退化解に陥りやすい特性があるため、2.5次元姿勢表現を採用し、訓練済みモデルの予測がすべてのカメラビューにおいて一貫性がありかつ妥当である場合にのみ最小化される新しい目的関数を提案します。我々の提案手法は、大規模データセット(Human3.6MおよびMPII-INF-3DHP)上で評価され、半教師付き/弱教師付き方法の中で最先端の性能を達成しています。