
要約
グループ活動認識は、複数人の集団が行っている行動を理解することを目的としている。これを解決するためには、複雑な時空間的相互作用を適切にモデル化することが鍵となる。従来の手法は、事前に定義されたグラフ上で推論を行うため、個々の人物に固有の相互作用の文脈を無視するという制約がある。さらに、計算コストが高く、過度なスムージング(over-smoothing)問題を引き起こしやすい推論スキームを採用している。本研究では、動的推論ネットワーク(Dynamic Inference Network; DIN)を提案することで、時空間的かつ個人特有の推論を実現する。DINは、動的関係モジュール(Dynamic Relation; DR)と動的ウォークモジュール(Dynamic Walk; DW)から構成される。まず、初期の時空間グラフ上に相互作用フィールドを初期化する。各相互作用フィールド内において、DRモジュールにより関係行列を予測し、DWモジュールにより動的ウォークオフセットを同時に推定することで、個人特有の相互作用グラフを構築する。この特定のグラフ上で特徴量を更新することで、個々の人物は局所的な初期化に基づき、グローバルなレベルの相互作用フィールドを獲得することができる。実験結果から、両モジュールの有効性が確認された。さらに、同一設定下で2つの代表的なデータセットにおいて、従来の最先端手法と比較して顕著な性能向上を達成しつつ、推論モジュールの計算負荷を大幅に低減している。