多光谱图像对能够提供互补的视觉信息,从而使行人检测系统更具鲁棒性和可靠性。为充分利用RGB与热红外(thermal IR)模态的优势,本文提出一种新颖的注意力驱动多光谱特征融合方法。在跨模态与模态内注意力模块的引导下,所提出的深度学习架构能够动态地权衡并融合多光谱特征。在两个公开的多光谱目标检测数据集上的实验结果表明,该方法在计算开销较低的情况下,显著提升了检测精度。