8日前

深層時系列符号化-復元を用いた複数インスタンスベースの動画異常検出

Ammar Mansoor Kamoona, Amirali Khodadadian Gosta, Alireza Bab-Hadiashar, Reza Hoseinnezhad
深層時系列符号化-復元を用いた複数インスタンスベースの動画異常検出
要約

本稿では、複数インスタンス学習(Multiple Instance Learning, MIL)を用いた弱教師ありの深層時系列符号化・復号手法を提案し、監視映像における異常検出に応用する。提案手法は学習段階において異常映像クリップと正常映像クリップの両方を活用する。このアプローチはMILフレームワークに基づいており、映像を「バッグ(bag)」、映像クリップをその中の「インスタンス(instance)」として扱う。本研究の主な貢献は、映像インスタンス間の時系列的関係を新たに捉えるアプローチを提示した点にある。従来の独立したインスタンスとして扱う手法とは異なり、本手法では映像クリップを順次的な視覚データとして扱い、空間時系列的な変化を捉えるための深層時系列符号化ネットワークを設計した。さらに、近年のコンピュータビジョン分野で提案された類似の損失関数よりも滑らかな新しい損失関数を提案し、これにより学習段階における収束速度の向上および局所最適解への敏感さの低減が実現された。提案する時系列符号化・復号アプローチに修正された損失関数を組み合わせ、シミュレーション実験において最先端技術と比較評価を行った。その結果、本手法は監視映像における異常検出の分野で、最先端の手法と同等またはそれ以上の性能を示した。

深層時系列符号化-復元を用いた複数インスタンスベースの動画異常検出 | 最新論文 | HyperAI超神経