
要約
近年、骨格ベースの動作認識は大きな成功を収めていますが、既存の多くの手法は大規模なモデルサイズと遅い実行速度という問題に直面しています。この課題を緩和するため、我々は骨格シーケンスの特性を分析し、骨格ベースの動作認識用にDouble-feature Double-motion Network(DD-Net)を提案しました。軽量なネットワーク構造(つまり、0.15百万パラメータ)を使用することで、DD-Netは非常に高速な処理速度を達成しており、1つのGPUでは3,500 FPS、1つのCPUでは2,000 FPSとなっています。堅牢な特徴量を用いることで、DD-Netは我々の実験データセットであるSHREC(手の動作)とJHMDB(体の動作)で最先端の性能を達成しました。本論文とともにコードも後日公開される予定です。