17日前

Poseはすべてである:ポーズのみを用いたグループ行動認識システム(POGARS)

Haritha Thilakarathne, Aiden Nibali, Zhen He, Stuart Morgan
Poseはすべてである:ポーズのみを用いたグループ行動認識システム(POGARS)
要約

本稿では、人物の追跡されたポーズのみを入力として用いて、集団活動を予測する新しい深層学習ベースの集団活動認識手法である「Pose Only Group Activity Recognition System(POGARS)」を提案する。従来の集団活動認識手法とは異なり、POGARSはピクセルデータからの特徴学習を省き、1次元畳み込みニューラルネットワーク(1D CNN)を用いて、集団活動に参加する個々の人物の時空間的動態を学習する。提案モデルは、空間的・時系列的アテンション機構を用いて各人物の重要度を推定し、マルチタスク学習により集団行動と個別行動の分類を同時に実行する。実験結果から、広く用いられている公開バレー球データセットにおいて、POGARSは最先端の手法と比較しても非常に競争力のある性能を達成することが確認された。さらに、RGB画像ではなくポーズ情報のみを入力とする本手法は、RGBを入力とする手法と比較して優れた汎化能力を示していることが実験により明らかになった。

Poseはすべてである:ポーズのみを用いたグループ行動認識システム(POGARS) | 最新論文 | HyperAI超神経