17 天前
用于细分辨率遥感图像语义分割的多注意力网络
{Peter M. Atkinson, Libo Wang, Jianlin Su, Chenxi Duan, Ce Zhang, Shunyi Zheng, Rui Li}
摘要
遥感图像的语义分割在土地资源管理、生物圈监测以及城市规划等多个领域中发挥着重要作用。尽管深度卷积神经网络显著提升了遥感图像语义分割的精度,但现有标准模型仍存在若干局限性。首先,对于U-Net等编码器-解码器架构而言,多尺度特征的利用存在信息利用率不足的问题,即低层特征与高层特征直接拼接,缺乏有效的特征优化与融合机制。其次,特征图之间的长距离依赖关系未能得到充分挖掘,导致各类语义类别对应的特征表示不够理想。第三,尽管点积注意力机制已被引入并应用于语义分割以建模长距离依赖,但其较高的时间和空间复杂度限制了其在大规模输入场景中的实际应用。为此,本文提出一种多注意力网络(Multi-Attention Network, MANet),通过多个高效注意力模块提取上下文依赖关系,以解决上述问题。本文设计了一种新型的核注意力(Kernel Attention)机制,具有线性时间复杂度,有效缓解了传统注意力机制带来的巨大计算负担。基于核注意力与通道注意力,MANet将ResNet-50提取的局部特征图与其对应的全局依赖关系进行融合,并自适应地重新加权相互依赖的通道特征图。在两个大规模高分辨率遥感图像数据集上的数值实验结果表明,所提出的MANet在性能上显著优于现有方法。代码已开源,获取地址为:https://github.com/lironui/Multi-Attention-Network。