17日前

3D人体ポーズ推定のためのネットワーク構造最適化

{ Yizhou Wang, Xiaoxuan Ma, Chunyu Wang, Hai Ci}
3D人体ポーズ推定のためのネットワーク構造最適化
要約

人体のポーズは、関節をノード、骨格をエッジとするグラフとして自然に表現できる。したがって、2Dポーズから3Dポーズを推定する際、グラフ畳み込みネットワーク(GCN)を適用するのは自然なアプローチである。本研究では、GCNと全結合ネットワーク(FCN)の両方がその特別なケースとなる汎用的な定式化を提案する。この定式化から、3Dポーズ推定に用いた場合、GCNには表現力の限界があることが明らかになった。この限界を克服するため、本定式化によって自然に実装可能な局所接続ネットワーク(LCN)を導入した。これにより、GCNに比べて顕著に表現能力が向上した。さらに、各関節はその近傍の少数の関節にのみ接続されているため、高い汎化能力を持つ。公開データセットを用いた実験の結果、本手法が以下の点で優れていることが示された:(1)最先端手法を上回る性能を発揮;(2)他のモデルと比較してデータ量の要求が少ない;(3)未知の動作やデータセットに対しても良好な汎化性能を示す。