17日前
自己蒸留型マスクドオートエンコーダーは効率的な動画異常検出に適している
Nicolae-Catalin Ristea, Florinel-Alin Croitoru, Radu Tudor Ionescu, Marius Popescu, Fahad Shahbaz Khan, Mubarak Shah

要約
本稿では、動画フレームレベルに適用可能な軽量なマスク付き自己符号化器(AE)に基づく、効率的な異常イベント検出モデルを提案する。本モデルの新規性は三つある。第一に、動き勾配に基づいてトークンに重みを付与する手法を導入し、静的な背景シーンから前面の物体へと注目を移行する。第二に、教師デコーダーと学生デコーダーをアーキテクチャに統合し、両デコーダーが出力する結果の乖離を活用して異常検出性能を向上させる。第三に、合成異常イベントを生成してトレーニング動画を拡張し、マスク付きAEモデルに、異常のない元のフレームと対応するピクセルレベルの異常マップを同時に再構成させる。本設計により、効率的かつ効果的なモデルが実現されたことが、Avenue、ShanghaiTech、UBnormal、UCSD Ped2の4つのベンチマーク上で実施された広範な実験によって示された。実証結果から、本モデルは速度と精度の優れたトレードオフを達成し、競合手法と比較してAUCスコアで優れた性能を発揮しながら、1655 FPSの処理速度を実現している。これにより、本モデルは競合手法と比較して8~70倍の高速性を有している。また、アブレーションスタディを通じて本モデルの設計の妥当性を検証した。本研究のコードは、以下のURLで公開されている:https://github.com/ristea/aed-mae。