要約
セキュリティ監視は、社会の調和と人々の平穏な生活を守るために極めて重要であり、社会の安定強化および生活の安全確保に大きな影響を与えます。動画監視データにおける異常のタイムリーかつ効果的・効率的な検出は、依然として課題となっています。本論文では、動画データからの異常検出を目的として、S²-VAEと呼ばれる新たなアプローチを提案する。S²-VAEは、2つの新規に提案されたニューラルネットワークから構成される:スタック型全結合変分自己符号化器(S_F-VAE)とスキップ畳み込みVAE(S_C-VAE)。S_F-VAEは、実データの分布をガウス混合モデルに類似した形で近似するための浅い生成モデルとして設計されたネットワークである。一方、S_C-VAEはS²-VAEの中心的な構成要素であり、畳み込みニューラルネットワーク(CNN)、変分自己符号化器(VAE)およびスキップ接続を活用する深層生成モデルである。S_F-VAEとS_C-VAEの両者は、効率的かつ効果的な生成モデルとしての性能を発揮し、局所的な異常イベントおよびグローバルな異常イベントの両方に対して優れた検出性能を達成する。提案手法S²-VAEは、4つの公開データセットを用いて評価された結果、最先端のアルゴリズムを上回る性能を示した。実装コードは、GitHubにて公開されており、https://github.com/tianwangbuaa/ から入手可能である。