
摘要
本文展示了如何通过一种简单的方法实现实时的视觉目标跟踪和半监督视频对象分割。我们提出的方法称为SiamMask,通过在流行的全卷积Siamese目标跟踪方法的离线训练过程中增加一个二值分割任务来改进其损失函数。训练完成后,SiamMask仅依赖于单个边界框初始化,并在线运行,以每秒55帧的速度生成类别无关的对象分割掩码和旋转边界框。尽管该方法简单、灵活且速度快,但我们的策略在VOT-2018实时跟踪器中建立了新的最先进水平,同时在DAVIS-2016和DAVIS-2017数据集上展示了具有竞争力的性能和最佳速度,用于半监督视频对象分割任务。项目网站为:http://www.robots.ox.ac.uk/~qwang/SiamMask。