17日前

空間時系列の分離されたジャイガーパズルを解くことで行う動画異常検出

Guodong Wang, Yunhong Wang, Jie Qin, Dongming Zhang, Xiuguo Bao, Di Huang
空間時系列の分離されたジャイガーパズルを解くことで行う動画異常検出
要約

ビデオ異常検出(Video Anomaly Detection: VAD)は、コンピュータビジョン分野における重要な課題である。近年の自己教師学習(self-supervised learning)の進展を踏まえ、本論文では直感的ではあるが挑戦的な前処理タスクとして「空間時系列ジグソーパズル(spatio-temporal jigsaw puzzles)」の解法に着目し、これを多ラベルの細分化分類問題として定式化する。本手法は従来の手法と比較して以下の三つの利点を有する:1)空間的および時系列的次元においてジグソーパズルを分離することで、それぞれが高判別性のある外観特徴と運動特徴を捉えることが可能となる;2)全順列(full permutations)を用いることで、さまざまな難易度をカバーする豊富なジグソーパズルを提供し、正常なイベントと異常なイベントの微細な空間時系列的差異を識別できるネットワークの学習を可能にする;3)事前学習モデルに依存せずに、エンドツーエンドのアプローチで前処理タスクを扱うことができる。本手法は3つの公開ベンチマークにおいて、最先端の手法を上回る性能を示した。特にShanghaiTech Campusデータセットでは、再構成や予測に基づく手法と比較して大幅な性能向上を達成した。