17日前
骨格ビデオ異常検出における明示的分布モデリングを用いた正則性学習
Shoubin Yu, Zhongyin Zhao, Haoshu Fang, Andong Deng, Haisheng Su, Dongliang Wang, Weihao Gan, Cewu Lu, Wei Wu

要約
監視映像における異常検出は、公共の安全を確保する上で極めて重要な課題である。ピクセルベースの異常検出手法とは異なり、ポーズベースの手法は高構造的なスケルトンデータを用いるため、計算負荷を低減するとともに、背景ノイズの悪影響を回避できる。しかし、ピクセルベース手法が光流(optical flow)など明示的な運動特徴を直接利用できるのに対し、ポーズベース手法は代替的な動的表現が不足しているという課題を抱えている。本論文では、確率論的視点からポーズ運動表現を提供する新しいモジュール「Motion Embedder(ME)」を提案する。さらに、自己教師付きのポーズ時空間再構成を実現する新たなタスク特化型空間時系列変換器(Spatial-Temporal Transformer, STT)を導入する。これらの2つのモジュールを統合した包括的な枠組みを構築し、ポーズの規則性学習を実現する「Motion Prior Regularity Learner(MoPRL)」を提案する。MoPRLは、複数の難易度の高いデータセットにおいて平均4.7%のAUC向上を達成し、最先端の性能を実現した。広範な実験により、提案する各モジュールの汎用性が検証された。