HyperAIHyperAI

Command Palette

Search for a command to run...

基于动态目标网络的快速视频目标分割

You He Huchuan Lu Jianming Zhang Zhe Lin Lu Zhang

摘要

我们提出一种新型的快速且精准的视频对象分割模型。该模型由两个卷积神经网络组成:动态定位网络(Dynamic Targeting Network, DTN)和掩码精炼网络(Mask Refinement Network, MRN)。DTN通过动态聚焦于目标对象周围的感兴趣区域来实现对目标的定位。其目标区域的预测由两个子分支完成:框传播(Box Propagation, BP)和框重识别(Box Re-identification, BR)。其中,BP分支计算效率高,但在目标发生大形变或被遮挡时表现较弱;BR分支在复杂场景下具有更强的鲁棒性,但计算开销较大。为此,我们设计了一个决策模块(Decision Module, DM),可自适应地为每一帧动态选择最优的子分支进行处理。最后,MRN用于在预测的目标区域内生成精细化的分割掩码。在两个公开数据集上的实验结果表明,所提模型在无需在线训练的情况下,显著优于现有方法,在精度与效率方面均表现出色;同时,在精度上可与基于在线训练的方法相媲美,且推理速度提升了一个数量级。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供