
要約
ビデオ異常検出(VAD)は、犯罪防止や国土安全保障において重要な役割を果たす、ビデオ内の疑わしいイベントを特定する技術です。本論文では、属性ベースの表現に依存する単純ながら非常に効果的なVAD手法を提案します。当手法の基本バージョンでは、各物体をその速度と姿勢で表現し、密度推定によって異常スコアを計算します。驚くことに、この単純な表現でもShanghaiTechという最も一般的に使用されるVADデータセットで最先端の性能を達成することができます。さらに、当手法の属性ベースの表現と既存の事前学習済み深層表現を組み合わせることで、Ped2、Avenue、ShanghaiTechにおいてそれぞれ99.1%、93.7%、85.9%のAUROC(Area Under the Receiver Operating Characteristic curve)を達成し、最先端の性能を発揮しました。