2 个月前

OneTracker:利用基础模型和高效调优统一视觉目标跟踪

Lingyi Hong; Shilin Yan; Renrui Zhang; Wanyun Li; Xinyu Zhou; Pinxue Guo; Kaixun Jiang; Yiting Chen; Jinglun Li; Zhaoyu Chen; Wenqiang Zhang
OneTracker:利用基础模型和高效调优统一视觉目标跟踪
摘要

视觉目标跟踪旨在根据目标对象在第一帧中的初始外观来定位每帧中的目标对象。根据输入模态的不同,跟踪任务可以分为RGB跟踪和RGB+X(例如RGB+N和RGB+D)跟踪。尽管输入模态不同,但跟踪的核心在于时间匹配。基于这一共同点,我们提出了一种统一各种跟踪任务的通用框架,称为OneTracker。OneTracker首先在一个名为基础跟踪器(Foundation Tracker)的RGB跟踪器上进行大规模预训练。这一预训练阶段使基础跟踪器具备了稳定的目标位置估计能力。然后我们将其他模态信息视为提示,并在此基础上构建提示跟踪器(Prompt Tracker)。通过冻结基础跟踪器并仅调整一些额外的可训练参数,提示跟踪器抑制了基础跟踪器的强大定位能力,并在下游的RGB+X跟踪任务中实现了参数高效的微调。为了评估我们提出的通用框架OneTracker(由基础跟踪器和提示跟踪器组成)的有效性,我们在11个基准数据集上的6个流行跟踪任务中进行了广泛的实验,结果表明我们的OneTracker优于其他模型,并达到了最先进的性能。

OneTracker:利用基础模型和高效调优统一视觉目标跟踪 | 最新论文 | HyperAI超神经