8 天前
基于多实例的深度时序编码-解码视频异常检测
Ammar Mansoor Kamoona, Amirali Khodadadian Gosta, Alireza Bab-Hadiashar, Reza Hoseinnezhad

摘要
本文提出了一种基于多实例学习(Multiple Instance Learning, MIL)框架的弱监督深度时空编码-解码方法,用于监控视频中的异常检测。该方法在训练阶段同时利用正常与异常视频片段,将整个视频视为一个“包”(bag),而视频片段则作为包中的“实例”(instance)。本研究的主要贡献在于提出了一种新颖的方法,用于建模视频实例之间的时序关联关系。与以往将视频片段视为独立实例的做法不同,本文将视频片段视为具有时序顺序的视觉序列数据,并设计了一种深度时序编码网络,以捕捉视频实例在时间维度上的空间-时序演化特征。此外,本文还提出了一种新型损失函数,相较于近期计算机视觉领域提出的类似损失函数,该函数具有更平滑的优化特性,从而在训练过程中表现出更快的收敛速度,并对局部极小值具有更强的鲁棒性。所提出的时序编码-解码框架结合改进的损失函数,在仿真实验中与当前最先进的方法进行了对比评估。实验结果表明,所提方法在监控视频异常检测任务中的性能达到或优于现有最先进水平。