
要約
人的動作は、関節の動きや「ジェスチャー」から構成されています。人間の骨格は、直感的に関節をノードとし、それらの間の自然な接続をエッジとする疎なグラフとして表現されます。グラフ畳み込みネットワーク(GCN)は、骨格ビデオから動作を認識するために使用されてきました。本研究では、変形可能な部品モデル(DPMs)に着想を得て、部品ベースのグラフ畳み込みネットワーク(PB-GCN)を導入します。骨格グラフを4つの部分グラフに分割し、それらの部分グラフ間に共有される関節を使用して、部品ベースのグラフ畳み込みネットワークで認識モデルを学習します。このモデルが、全体的な骨格グラフを使用するモデルと比較して認識性能が向上することを示しています。3次元関節座標ではなく、相対座標と時間的変位を使用することで性能が向上することも示しています。当該モデルは、骨格動作認識における2つの挑戦的なベンチマークデータセットNTU RGB+DおよびHDM05で最先端の性能を達成しました。