
要約
疎結合に基づく異常検出の可能性に着目し、本研究では時間的に一貫性のある疎結合(Temporal Coherence Sparse Coding: TSC)を提案する。本手法では、隣接するフレームが類似した再構成係数によって符号化されるように制約を課す。さらに、TSCを特殊なスタック型再帰型ニューラルネットワーク(stacked Recurrent Neural Network: sRNN)にマッピングする。sRNNを用いることで、TSCにおける非自明なハイパーパラメータ選定を回避しつつ、すべてのパラメータを同時に学習可能となる。また、浅いsRNN構造を採用することで、前向き伝搬(forward pass)1回で再構成係数を推定可能となり、疎係数の学習にかかる計算コストを大幅に削減できる。本研究の貢献は以下の2点である:i) 時間的に一貫性を持つTSCを提案し、これをsRNNにマッピングすることで、パラメータ最適化を容易にし、異常予測の速度を向上させることを実現した。ii) 既存のすべての異常検出データセットの合計を上回る規模であり、データ量とシーンの多様性の両面で非常に大規模なデータセットを構築した。玩具データセットおよび実データセットを用いた広範な実験により、本手法が従来手法を一貫して上回ることが示され、提案手法の有効性が検証された。