
摘要
我们提出了一种基于测地距离的无监督显著视频对象分割方法。与传统方法不同,本方法通过计算稳健的测地距离,将显著性作为先验信息引入对象识别过程。我们选取两种具有区分性的视觉特征:空间边缘与时间运动边界,作为前景对象位置的指示信号。首先,利用这些指示信号的测地距离生成逐帧的时空显著性图。基于观察发现,前景区域通常被具有高时空边缘值的区域所包围,因此测地距离能够提供前景与背景的初始估计。随后,通过后续帧中到背景区域的测地距离,进一步生成高质量的显著性结果。基于所得的显著性图,我们构建了前景与背景的全局外观模型。结合运动连续性约束,为每一帧建立动态位置模型。最终,将时空显著性图、外观模型与动态位置模型整合进一个能量最小化框架,实现空间与时间上均一致的物体分割。在基准视频数据集上的大量定量与定性实验表明,所提方法在性能上优于当前最先进的算法。