17日前

3次元人体ポーズ推定のためのRegular Splitting Graph Network

Tanvir Hassan, A. Ben Hamza
3次元人体ポーズ推定のためのRegular Splitting Graph Network
要約

2Dから3Dへの人体ポーズ推定を目的としたグラフ畳み込みアーキテクチャに基づく手法では、人体の骨格がノードとして関節、エッジとして隣接関節間の接続を持つ無向グラフとしてモデル化されるのが一般的である。しかし、これらの手法の多くは、関節間の関係性を1次近傍(first-order neighbors)のみに注目して学習する傾向にあり、高次の近傍(higher-order neighbors)を無視するため、遠く離れた関節間の関係性を十分に活用できていない。本論文では、行列分割(matrix splitting)と重み・隣接行列の調節(weight and adjacency modulation)を組み合わせることで、2Dから3Dへの人体ポーズ推定を実現する「高次正則分割グラフネットワーク(Higher-order Regular Splitting Graph Network, RS-Net)」を提案する。本手法の核心的なアイデアは、複数ステップにわたる隣接領域(multi-hop neighborhoods)を用いて関節間の長距離依存性を捉え、骨格に関連する隣接行列に加えて、各関節ごとに異なる調節ベクトルを学習するとともに、学習可能な調節行列を導入することである。この調節行列により、グラフ構造を動的に調整し、関節間の新たな接続を学習するための追加エッジを導入することが可能となる。また、すべての近接関節に共通の重み行列を使用するのではなく、特徴ベクトルの集約前に重みの非共有(weight unsharing)を適用することで、異なる関節間の関係性をより適切に捉えることが可能となる。2つのベンチマークデータセットを用いた実験および消去実験の結果から、本モデルの有効性が示され、近年の最先端手法と比較して優れた性能を達成した。