Command Palette
Search for a command to run...
基于动态目标网络的快速视频目标分割
基于动态目标网络的快速视频目标分割
You He Huchuan Lu Jianming Zhang Zhe Lin Lu Zhang
摘要
我们提出一种新型的快速且精准的视频对象分割模型。该模型由两个卷积神经网络组成:动态定位网络(Dynamic Targeting Network, DTN)和掩码精炼网络(Mask Refinement Network, MRN)。DTN通过动态聚焦于目标对象周围的感兴趣区域来实现对目标的定位。其目标区域的预测由两个子分支完成:框传播(Box Propagation, BP)和框重识别(Box Re-identification, BR)。其中,BP分支计算效率高,但在目标发生大形变或被遮挡时表现较弱;BR分支在复杂场景下具有更强的鲁棒性,但计算开销较大。为此,我们设计了一个决策模块(Decision Module, DM),可自适应地为每一帧动态选择最优的子分支进行处理。最后,MRN用于在预测的目标区域内生成精细化的分割掩码。在两个公开数据集上的实验结果表明,所提模型在无需在线训练的情况下,显著优于现有方法,在精度与效率方面均表现出色;同时,在精度上可与基于在线训练的方法相媲美,且推理速度提升了一个数量级。