8 个月前

计算机视觉

You He Huchuan Lu Jianming Zhang Zhe Lin Lu Zhang

摘要

我们提出一种新型的快速且精准的视频对象分割模型。该模型由两个卷积神经网络组成：动态定位网络（Dynamic Targeting Network, DTN）和掩码精炼网络（Mask Refinement Network, MRN）。DTN通过动态聚焦于目标对象周围的感兴趣区域来实现对目标的定位。其目标区域的预测由两个子分支完成：框传播（Box Propagation, BP）和框重识别（Box Re-identification, BR）。其中，BP分支计算效率高，但在目标发生大形变或被遮挡时表现较弱；BR分支在复杂场景下具有更强的鲁棒性，但计算开销较大。为此，我们设计了一个决策模块（Decision Module, DM），可自适应地为每一帧动态选择最优的子分支进行处理。最后，MRN用于在预测的目标区域内生成精细化的分割掩码。在两个公开数据集上的实验结果表明，所提模型在无需在线训练的情况下，显著优于现有方法，在精度与效率方面均表现出色；同时，在精度上可与基于在线训练的方法相媲美，且推理速度提升了一个数量级。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

You He Huchuan Lu Jianming Zhang Zhe Lin Lu Zhang

摘要

我们提出一种新型的快速且精准的视频对象分割模型。该模型由两个卷积神经网络组成：动态定位网络（Dynamic Targeting Network, DTN）和掩码精炼网络（Mask Refinement Network, MRN）。DTN通过动态聚焦于目标对象周围的感兴趣区域来实现对目标的定位。其目标区域的预测由两个子分支完成：框传播（Box Propagation, BP）和框重识别（Box Re-identification, BR）。其中，BP分支计算效率高，但在目标发生大形变或被遮挡时表现较弱；BR分支在复杂场景下具有更强的鲁棒性，但计算开销较大。为此，我们设计了一个决策模块（Decision Module, DM），可自适应地为每一帧动态选择最优的子分支进行处理。最后，MRN用于在预测的目标区域内生成精细化的分割掩码。在两个公开数据集上的实验结果表明，所提模型在无需在线训练的情况下，显著优于现有方法，在精度与效率方面均表现出色；同时，在精度上可与基于在线训练的方法相媲美，且推理速度提升了一个数量级。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供