
摘要
基于可见光和热红外图像融合的目标跟踪,即RGB-T跟踪,在近年来受到了研究人员越来越多的关注。如何以更低的计算成本实现两种模态信息的更全面融合,一直是研究人员探索的问题。最近,随着计算机视觉领域提示学习(Prompt Learning)的兴起,我们可以更好地将大型视觉模型的知识迁移到下游任务中。考虑到可见光和热红外模态之间的强互补性,我们提出了一种基于两种模态之间相互提示学习的跟踪架构。此外,我们设计了一种轻量级提示器,该提示器在两个维度上结合了注意力机制,以较低的计算成本将信息从一种模态传递到另一种模态,并将其嵌入到骨干网络的每一层中。大量实验表明,我们提出的跟踪架构不仅有效而且高效,在保持高运行速度的同时达到了最先进的性能。