
摘要
我们提出了一种高效的半监督视频对象分割方法。该方法在分割精度上达到与当前最先进方法相当的水平,同时运行时间仅为其他方法的极小部分。为此,我们设计了一种深度孪生编码器-解码器网络,该网络充分利用了掩码传播(mask propagation)与目标检测的优势,同时规避了两种方法各自的局限性。我们的网络通过结合合成数据与真实数据的两阶段训练过程进行学习,能够在无需在线学习或后处理的情况下稳定运行。我们在四个基准数据集上验证了该方法,这些数据集涵盖了单对象与多对象分割任务。在所有基准测试中,我们的方法在保持相当精度的同时,实现了数量级的加速。此外,我们还进行了广泛的消融实验和可扩展性研究,以深入分析和评估所提出框架的有效性。