摘要
在视觉感知与计算机视觉领域,理解视觉场景中注意力聚焦机制一直是备受关注的重要问题。本文提出一种扫描路径(scanpath)的动态模型,该模型可被解释为一种与力学原理相关的变分定律,其中注意力焦点受到某种类重力场的作用。驱动眼球运动的分布式虚拟质量与视频中细节信息和运动的存在密切相关。与现有大多数模型不同,本方法并不直接估计显著性图(saliency map),而是通过预测眼动轨迹,实现对兴趣区域随时间演化的积分整合。此外,该动态模型还引入了“返回抑制”(inhibition-of-return)机制,以实现对注视点(fixations)与快速扫视(saccades)的仿真。所提出的模型运动微分方程通过数值积分方法求解,可用于在图像与视频上模拟扫描路径。在涵盖广泛数据集的显著性预测与扫描路径预测任务中,实验结果验证了该理论的有效性。尤其在扫描路径预测方面,模型取得了顶级性能,这也正是本研究模型的核心目标。