15 天前
FEANet:用于RGB-热成像实时语义分割的特征增强注意力网络
Fuqin Deng, Hua Feng, Mingjian Liang, Hongmin Wang, Yong Yang, Yuan Gao, Junfeng Chen, Junjie Hu, Xiyue Guo, Tin Lun Lam

摘要
近年来,RGB-热成像(RGB-T)信息在语义分割任务中得到了广泛研究。然而,大多数现有的RGB-T语义分割方法为了实现实时推理速度,通常会牺牲空间分辨率,从而导致性能下降。为更有效地提取细节空间信息,本文提出了一种两阶段的特征增强注意力网络(Feature-Enhanced Attention Network, FEANet),用于RGB-T语义分割任务。具体而言,我们设计了一种特征增强注意力模块(Feature-Enhanced Attention Module, FEAM),从通道和空间两个维度挖掘并增强多层级特征。得益于所提出的FEAM模块,FEANet能够有效保留空间信息,并将更多注意力集中于融合后的RGB-T图像中高分辨率特征上。在城市场景数据集上的大量实验表明,与现有最先进(SOTA)的RGB-T方法相比,本方法在客观指标和主观视觉效果上均表现出更优性能,全局平均准确率(global mAcc)提升2.6%,全局平均交并比(global mIoU)提升0.8%。对于分辨率为480×640的RGB-T测试图像,本方法在NVIDIA GeForce RTX 2080 Ti显卡上可实现实时运行。