Command Palette
Search for a command to run...
監視映像における現実世界の異常検出
監視映像における現実世界の異常検出
Sultani Waqas Chen Chen Shah Mubarak
概要
監視映像は多様な現実的な異常を捉えることができる。本論文では、正常な映像と異常な映像の両方を活用して異常を学習する手法を提案する。訓練用映像において異常セグメントやクリップを手動でラベル付けすることは非常に時間がかかるため、その手間を回避するために、弱教師あり学習(weakly supervised learning)を活用した深層マルチインスタンスランク付けフレームワークを用いて異常を学習する。具体的には、訓練ラベルがクリップレベルではなく動画レベルで与えられる(正常または異常)弱教師付きの訓練データを用いる。本手法では、正常および異常動画を「バッグ(bag)」、動画セグメントを「インスタンス(instance)」とみなし、マルチインスタンス学習(Multiple Instance Learning, MIL)の枠組みに基づいて、異常動画セグメントに対して高い異常スコアを予測する深層異常ランク付けモデルを自動的に学習する。さらに、訓練過程における異常の局在化をより正確にするために、ランク損失関数にスパース性と時系列的滑らかさの制約を導入する。また、本研究では、13種類の現実的な異常(たとえば、喧嘩、交通事故、侵入、強盗など)および通常の行動を含む、128時間に及ぶ大規模で世界初の監視映像データセットを新たに構築した。このデータセットは1900本の長時間かつトリムされていない実世界の監視映像から構成されており、2つのタスクに利用可能である。第一に、すべての異常を1つのグループ、すべての正常な行動を別のグループとして扱う一般的な異常検出。第二に、13種類の異常行動それぞれを識別するタスク。実験結果から、提案手法であるMILベースの異常検出手法は、最先端の手法と比較して、異常検出性能において顕著な向上を達成したことが示された。また、近年の深層学習ベースのアプローチの異常行動認識性能についても結果を提示した。これらのベースライン手法の低さは、本データセットが極めて挑戦的であることを示しており、今後の研究に新たな機会を提供する。本データセットは以下のURLから入手可能である:https://webpages.uncc.edu/cchen62/dataset.html