8 个月前

计算机视觉

计算机视觉

Yaozong Zheng Bineng Zhong* Qihua Liang Zhiyi Mo Shengping Zhang Xianxian Li

摘要

在线上下文推理和连续视频帧之间的关联对于视觉跟踪中的实例感知至关重要。然而，大多数当前表现最佳的跟踪器仍然依赖于参考帧和搜索帧之间稀疏的时间关系，通过离线模式进行工作。因此，它们只能在每对图像内独立交互，并建立有限的时间相关性。为了解决上述问题，我们提出了一种简单、灵活且有效的视频级跟踪流水线，命名为ODTrack，该方法以在线令牌传播的方式密集地关联视频帧的上下文关系。ODTrack接收任意长度的视频帧，以捕捉实例的空间-时间轨迹关系，并将目标的判别特征（定位信息）压缩成一个令牌序列，实现帧间关联。这一新方案带来了以下好处：1) 纯净的令牌序列可以作为下一个视频帧推理的提示，从而利用过去的信息指导未来的推理；2) 通过令牌序列的迭代传播有效避免了复杂的在线更新策略，因此我们可以实现更高效模型表示和计算。ODTrack在七个基准测试中实现了新的最先进（SOTA）性能，同时运行速度达到实时水平。代码和模型可在\url{https://github.com/GXNU-ZhongLab/ODTrack}获取。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Yaozong Zheng Bineng Zhong* Qihua Liang Zhiyi Mo Shengping Zhang Xianxian Li

摘要

在线上下文推理和连续视频帧之间的关联对于视觉跟踪中的实例感知至关重要。然而，大多数当前表现最佳的跟踪器仍然依赖于参考帧和搜索帧之间稀疏的时间关系，通过离线模式进行工作。因此，它们只能在每对图像内独立交互，并建立有限的时间相关性。为了解决上述问题，我们提出了一种简单、灵活且有效的视频级跟踪流水线，命名为ODTrack，该方法以在线令牌传播的方式密集地关联视频帧的上下文关系。ODTrack接收任意长度的视频帧，以捕捉实例的空间-时间轨迹关系，并将目标的判别特征（定位信息）压缩成一个令牌序列，实现帧间关联。这一新方案带来了以下好处：1) 纯净的令牌序列可以作为下一个视频帧推理的提示，从而利用过去的信息指导未来的推理；2) 通过令牌序列的迭代传播有效避免了复杂的在线更新策略，因此我们可以实现更高效模型表示和计算。ODTrack在七个基准测试中实现了新的最先进（SOTA）性能，同时运行速度达到实时水平。代码和模型可在\url{https://github.com/GXNU-ZhongLab/ODTrack}获取。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供