8 个月前

计算机视觉

计算机视觉

Yifan Bai Zeyang Zhao Yihong Gong Xing Wei

摘要

我们介绍了ARTrackV2，该系统集成了跟踪领域的两个关键方面：确定目标对象的位置（定位）和描述其在视频帧间的外观（外观分析）。在此前版本的基础上，ARTrackV2通过引入一个统一的生成框架，以自回归的方式“读取”目标对象的轨迹并“重述”其外观。这种方法促进了时间连续性的建模方法，该方法在先前估计的引导下，对运动和视觉特征的联合演化进行建模。此外，ARTrackV2以其高效性和简洁性脱颖而出，摒弃了效率较低的帧内自回归以及用于外观更新的手动调整参数。尽管设计简单，ARTrackV2在主流基准数据集上仍达到了最先进的性能，并展示了显著的效率提升。特别是在GOT-10k数据集上，ARTrackV2取得了79.5%的AO分数，在TrackingNet数据集上取得了86.1%的AUC分数，同时比ARTrack快3.6倍。代码将对外发布。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Yifan Bai Zeyang Zhao Yihong Gong Xing Wei

摘要

我们介绍了ARTrackV2，该系统集成了跟踪领域的两个关键方面：确定目标对象的位置（定位）和描述其在视频帧间的外观（外观分析）。在此前版本的基础上，ARTrackV2通过引入一个统一的生成框架，以自回归的方式“读取”目标对象的轨迹并“重述”其外观。这种方法促进了时间连续性的建模方法，该方法在先前估计的引导下，对运动和视觉特征的联合演化进行建模。此外，ARTrackV2以其高效性和简洁性脱颖而出，摒弃了效率较低的帧内自回归以及用于外观更新的手动调整参数。尽管设计简单，ARTrackV2在主流基准数据集上仍达到了最先进的性能，并展示了显著的效率提升。特别是在GOT-10k数据集上，ARTrackV2取得了79.5%的AO分数，在TrackingNet数据集上取得了86.1%的AUC分数，同时比ARTrack快3.6倍。代码将对外发布。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供