
要約
私たちは教師-学習者学習フレームワークに基づく新しい手法を提案します。この手法は3次元人間姿勢推定において、3次元アノテーションや補助情報なしで使用されます。この非監督学習問題を解決するために、教師ネットワークではポーズ辞書ベースのモデリングを用いて正則化を行い、物理的に妥当な3次元姿勢を推定します。教師ネットワークにおける分解の曖昧性に対処するため、3次元回転不変性プロパティを促進するサイクル一貫性アーキテクチャを提案します。さらに推定精度を向上させるために、学習者ネットワークでは柔軟性を持つ新しいグラフ畳み込みネットワーク(Graph Convolution Network)を採用し、直接3次元座標を推定します。また、幾何学的一貫性を利用するため、教師ネットワークからの知識蒸留と組み合わせて3次元回転等変性プロパティを促進する別のサイクル一貫性アーキテクチャが採用されています。私たちはHuman3.6MおよびMPI-INF-3DHPで広範な実験を行いました。本手法は最先端の非監督方法と比較して3D関節予測誤差を11.4%削減し、Human3.6Mにおいて補助情報を使用する多くの弱い監督方法よりも優れた性能を示しました。コードはhttps://github.com/sjtuxcx/ITES で公開される予定です。