12日前
周囲を観察して異常を検出する:コンテキスト・モーション関係学習を用いた弱教師あり異常検出
{Sangyoun Lee, Kyungjae Lee, Chaewon Park, Sangwon Hwang, Minjung Kim, MyeongAh Cho}

要約
弱教師付き動画異常検出(Weakly-supervised Video Anomaly Detection)とは、動画レベルのラベル付き学習データを用いてフレームレベルの異常を検出するタスクである。単一のバックボーンブランチを用いて、弱いラベルによる最小限の監視情報からクラス代表的な特徴を抽出することは困難である。さらに、現実世界の状況においては、正常と異常の境界が曖昧であり、状況に応じて変化する。たとえば、走る人の同一の動作でも、周囲が運動場か道路かによって異常性が異なる。このため、本研究の目的は、単一ブランチからの特徴間の相対的な差を拡大することで、判別力のある特徴を抽出することにある。提案するクラス活性化特徴学習(Class-Activate Feature Learning, CLAV)では、クラスに応じて暗黙的に活性化される重みに基づいて特徴を抽出し、その後、相対距離学習によりクラス間の特徴ギャップを拡大する。また、複雑かつ多様なシーンにおける異常の識別において、文脈と運動の関係性が重要であるため、時間的依存性や運動情報のみに依存するのではなく、周囲の外観と運動の関係性をモデル化する「文脈-運動関係モジュール(Context--Motion Interrelation Module, CoMo)」を提案する。提案手法は、大規模な実世界データセットを含む4つのベンチマークにおいて、最先端(SOTA)の性能を達成しており、定性的な結果の分析および一般化能力の評価を通じて、関係性情報の重要性を実証している。