
摘要
由于监控视频中存在类内差异巨大、图像分辨率低等重大挑战,上下文信息在实现准确且鲁棒的事件识别任务中正发挥着日益重要的作用。上下文信息通常可划分为特征级上下文、语义级上下文和先验级上下文三个层次。这三个层次的上下文分别提供了对事件识别任务至关重要的自下而上、中层以及自上而下的信息支持。与现有研究通常仅在三个层次中的某一个层面整合上下文信息不同,本文提出一种分层上下文模型,能够同时利用三个层次的上下文信息,并系统性地将其融入事件识别过程。为应对模型层次结构所带来的学习与推理挑战,本文基于变分贝叶斯(variational Bayes)方法,设计了完整的模型学习与推理算法。在VIRAT 1.0和2.0地面实况数据集上的实验结果表明,所提出的分层上下文模型在面对类内差异大、图像分辨率低等严峻挑战时,仍能显著提升事件识别的性能,验证了其有效性。