
摘要
在视频级标签下的视频异常检测目前仍是一项具有挑战性的任务。先前的研究在判断视频序列中是否包含异常方面取得了一定进展,但大多数方法难以在时间维度上准确地定位异常事件。本文提出一种弱监督异常定位(Weakly Supervised Anomaly Localization, WSAL)方法,专注于在异常视频中实现异常片段的时序定位。受异常视频中外观差异的启发,本文通过评估相邻时间片段之间的演化关系来实现异常片段的定位。为此,我们提出一种高阶上下文编码模型,不仅能够提取语义表征,还能度量动态变化,从而有效利用时间上下文信息。此外,为充分挖掘空间上下文信息,直接从片段表征中提取局部语义特征。将动态变化特征与局部语义信息进行高效聚合,以获得最终的异常得分。为进一步应对异常检测中噪声干扰以及缺乏定位引导的问题,本文还提出一种增强策略。同时,为满足异常检测基准测试对多样性需求,我们构建了一个新的交通异常数据集(Traffic Anomaly Dataset, TAD),该数据集聚焦于交通场景,与当前主流的异常检测评估基准存在显著差异。大量实验验证了各组件的有效性,所提方法在UCF-Crime和TAD两个数据集上均取得了新的最先进性能。