18日前

3次元行動認識のためのグローバルコンテキスト感知型アテンションLSTMネットワーク

{Ling-Yu Duan, Ping Hu, Gang Wang, Alex C. Kot, Jun Liu}
3次元行動認識のためのグローバルコンテキスト感知型アテンションLSTMネットワーク
要約

長短期記憶(Long Short-Term Memory, LSTM)ネットワークは、時系列データにおける動的特性および依存関係を効果的にモデル化できる点から、3次元人体動作認識において優れた性能を示している。しかし、すべての関節が動作解析に有用というわけではなく、無関係な関節はしばしばノイズを引き起こすため、有用な関節に注目する必要がある。一方で、従来のLSTMは強力な注目(attention)機能を備えていない。そこで本研究では、3次元動作認識を目的として、グローバルな文脈情報を活用して動作系列における有用な関節に選択的に注目できる新たなLSTMネットワーク、すなわち「グローバルコンテキスト認識型注目LSTM(Global Context-Aware Attention LSTM, GCA-LSTM)」を提案する。さらに、動作系列に対する信頼性の高い注目表現を実現するため、反復的に注目性能を向上させる再帰的注目メカニズムを導入した。実験の結果、本提案手法はエンドツーエンドで設計されたネットワークとして、スケルトン系列の各フレームにおいて最も情報を含む関節に確実に注目できることを示した。また、3次元動作認識における3つの難易度の高いデータセットにおいて、最先端の性能を達成した。