8 个月前

计算机视觉

Shuangrui Ding; Weidi Xie; Yabo Chen; Rui Qian; Xiaopeng Zhang; Hongkai Xiong; Qi Tian

摘要

本文研究了视频中无监督物体发现的任务。先前的研究通过处理光流来分割物体，已经取得了令人鼓舞的结果。然而，以光流作为输入带来了两个缺点。首先，当物体静止或部分被遮挡时，光流无法捕捉到足够的线索。其次，由于缺乏纹理信息，仅从光流输入中建立时间连贯性具有挑战性。为了解决这些限制，我们提出了一种直接处理连续RGB帧的模型，并使用分层表示推断任意两帧之间的光流，其中透明度通道被视为分割结果。此外，为了强制物体永久性，我们在从随机配对帧推断出的掩码上应用了时间一致性损失，这些掩码反映了不同速度的运动，并鼓励模型即使在当前时间点物体没有移动的情况下也能进行分割。实验结果表明，在三个公开的视频分割数据集（DAVIS2016、SegTrackv2 和 FBMS-59）上，我们的方法优于现有的最先进方法，并且通过避免计算光流作为输入所带来的额外开销，实现了更高的计算效率。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

Shuangrui Ding; Weidi Xie; Yabo Chen; Rui Qian; Xiaopeng Zhang; Hongkai Xiong; Qi Tian

摘要

本文研究了视频中无监督物体发现的任务。先前的研究通过处理光流来分割物体，已经取得了令人鼓舞的结果。然而，以光流作为输入带来了两个缺点。首先，当物体静止或部分被遮挡时，光流无法捕捉到足够的线索。其次，由于缺乏纹理信息，仅从光流输入中建立时间连贯性具有挑战性。为了解决这些限制，我们提出了一种直接处理连续RGB帧的模型，并使用分层表示推断任意两帧之间的光流，其中透明度通道被视为分割结果。此外，为了强制物体永久性，我们在从随机配对帧推断出的掩码上应用了时间一致性损失，这些掩码反映了不同速度的运动，并鼓励模型即使在当前时间点物体没有移动的情况下也能进行分割。实验结果表明，在三个公开的视频分割数据集（DAVIS2016、SegTrackv2 和 FBMS-59）上，我们的方法优于现有的最先进方法，并且通过避免计算光流作为输入所带来的额外开销，实现了更高的计算效率。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

基于运动诱导的自监督视频中物体发现 | 论文 | HyperAI超神经