17 天前
通过求解解耦的时空拼图进行视频异常检测
Guodong Wang, Yunhong Wang, Jie Qin, Dongming Zhang, Xiuguo Bao, Di Huang

摘要
视频异常检测(Video Anomaly Detection, VAD)是计算机视觉领域的重要研究课题。受自监督学习近期进展的启发,本文通过解决一个直观但具有挑战性的预训练任务——时空拼图(spatio-temporal jigsaw puzzles),来实现VAD,并将该任务建模为多标签细粒度分类问题。所提出的方法相较于现有方法具有以下优势:1)在空间与时间维度上解耦时空拼图任务,分别用于捕捉高度判别性的外观特征与运动特征;2)采用全排列方式生成丰富多样的拼图样本,覆盖不同难度级别,使网络能够有效区分正常与异常事件之间细微的时空差异;3)预训练任务以端到端的方式完成,无需依赖任何预训练模型。在三个公开基准数据集上的实验结果表明,该方法显著优于当前最先进的技术,尤其在ShanghaiTech Campus数据集上,性能大幅超越基于重建与预测的现有方法。