2ヶ月前
骨格に基づく人間行動認識におけるグローバルコンテキストに注意を払うLSTMネットワークの利用
Jun Liu; Gang Wang; Ling-Yu Duan; Kamila Abdiyeva; Alex C. Kot

要約
3次元骨格シーケンスにおける人間の動作認識は、多くの研究者の注目を集めています。最近、Long Short-Term Memory (LSTM) ネットワークがこのタスクにおいて有望な性能を示しており、これはシーケンシャルデータの依存関係と動態をモデル化する能力に優れているためです。ただし、すべての骨格ジョイントが動作認識に有用というわけではなく、無関係なジョイントはしばしばノイズをもたらし、性能を低下させることがあります。したがって、有用なジョイントに注目する必要があります。しかし、従来のLSTMネットワークには明確な注意能力がありません。本論文では、骨格に基づく動作認識のために新しいクラスのLSTMネットワークであるGlobal Context-Aware Attention LSTM (GCA-LSTM) を提案します。このネットワークは、各骨格シーケンスの各フレームで有用なジョイントを選択的に注視できるようになります。これはグローバルコンテキストメモリセルを使用することにより可能となります。さらに、当該ネットワークの注意能力を向上させるために再帰的な注意機構を導入しました。これにより、ネットワークの注意性能は段階的に向上します。また、当該ネットワークを効果的に学習させるためにステップワイズトレーニングスキームも提案しています。我々のアプローチは5つの挑戦的なベンチマークデータセットにおいて最新の性能を達成しており、骨格に基づく動作認識分野での優れた成果を示しています。