
要約
RNNに基づくアプローチは、骨格情報(スケルトン入力)を用いた行動認識において優れた性能を達成している。現在のこれらの手法は、主に関節の座標を入力として限定し、RNNモデルを空間領域にさまざまな方法で拡張することで精度を向上させている。このようなモデルは関節座標から異なる部位間の関係を直接捉えるが、本研究ではRNNモデルの性能向上とは異なる方向性である、汎用的な空間モデリング手法を提案する。具体的には、先行研究の進化に着目し、単純な幾何学的特徴量の集合を選定する。3層のLSTMフレームワークを用いた実験において、関節と選択された直線間の距離に基づく幾何学的関係特徴量が他の特徴量を上回り、4つのデータセットにおいて最先端の性能を達成することを確認した。さらに、幾何学的特徴量によって学習された最初のLSTM層における入力ゲート重みのスパース性を示し、関節と直線間の距離を入力として利用することで、訓練に必要なデータ量が少なくなることを実証した。