2 个月前
SWEM:基于序列加权期望最大化实现实时视频对象分割
Zhihui Lin; Tianyu Yang; Maomao Li; Ziyu Wang; Chun Yuan; Wenhao Jiang; Wei Liu

摘要
基于匹配的方法,尤其是基于时空记忆的方法,在半监督视频对象分割(VOS)中显著领先于其他解决方案。然而,不断增长和冗余的模板特征导致了推理效率低下。为了解决这一问题,我们提出了一种新颖的顺序加权期望最大化(Sequential Weighted Expectation-Maximization, SWEM)网络,以大幅减少记忆特征的冗余。与以往仅检测帧间特征冗余的方法不同,SWEM通过利用顺序加权EM算法合并帧内和帧间的相似特征。此外,自适应权重的帧特征赋予SWEM表示困难样本的灵活性,提高了模板的区分能力。此外,所提出的方法在内存中保持固定数量的模板特征,从而确保VOS系统的稳定推理复杂度。在常用的DAVIS和YouTube-VOS数据集上进行的大量实验验证了SWEM的高度效率(36 FPS)和高性能(在DAVIS 2017验证数据集上的$\mathcal{J}\&\mathcal{F}$得分为84.3%)。代码可在以下链接获取:https://github.com/lmm077/SWEM。