18 天前

用于视频显著目标检测的动态上下文感知过滤网络

{Zhongxuan Luo, Huchuan Lu, Jingjing Li, Wei Ji, Shunyu Yao, Yongri Piao, Yifei Wang, Jie Liu, Miao Zhang}
用于视频显著目标检测的动态上下文感知过滤网络
摘要

捕捉帧间动态变化的能力对于视频显著性目标检测(VSOD)的发展至关重要。尽管已有大量研究在此领域取得了显著成果,但对视频动态特性的深层次理解仍有待深入。本文旨在回答以下两个关键问题:模型如何自适应地应对动态变化,并在真实环境中感知细微差异?时空动态信息如何在时间维度上有效融入空间特征中?为此,我们提出了一种动态上下文感知滤波网络(DCFNet),其核心包含一个动态上下文感知滤波模块(DCFM)以及一种高效的双向动态融合策略。所提出的DCFM通过提取连续帧之间的位置相关性,为动态滤波器的生成提供了新思路;而双向动态融合策略则以动态方式促进空间与时间信息之间的交互。实验结果表明,所提方法在多数VSOD数据集上均达到了当前最优性能,同时保持了28帧/秒的实时处理速度。项目源代码已公开,可访问 https://github.com/OIPLab-DUT/DCFNet 获取。