Command Palette
Search for a command to run...
3D人体ポーズ推定におけるモビウスグラフ畳み込みネットワークの利用
3D人体ポーズ推定におけるモビウスグラフ畳み込みネットワークの利用
Niloofar Azizi Horst Possegger Emanuele Rodolà Horst Bischof
概要
3次元人体ポーズ推定は、人間の行動を理解する上で基盤的な技術である。近年、グラフ畳み込みネットワーク(GCN)を用いたアプローチにより、最先端の性能が達成されており、非常に軽量なアーキテクチャを実現している。しかし、GCNの主要な限界は、関節間のすべての変換を明示的に表現できない点にある。この課題を解決するために、本研究ではモビウス変換(Möbius変換)を活用した新規なスペクトル型GCN、すなわちMöbiusGCNを提案する。特に、この手法により関節間の変換を直接的かつ明示的に表現可能となり、大幅にコンパクトな表現が可能となる。従来の最も軽量なアーキテクチャと比較しても、本手法はパラメータ数を90〜98%削減でき、最も軽量なMöbiusGCNではわずか0.042Mの学習可能なパラメータで済む。パラメータの劇的削減に加え、関節の変換を明示的に表現することで、最先端の性能を達成することも可能となった。本手法の有効性を、困難なポーズ推定ベンチマークであるHuman3.6MおよびMPI-INF-3DHPにおいて評価した結果、MöbiusGCNが最先端の性能を達成するとともに、優れた一般化能力を示した。