17 天前

HMANet:用于图像超分辨率的混合多轴聚合网络

Shu-Chuan Chu, Zhi-Chao Dou, Jeng-Shyang Pan, Shaowei Weng, Junbao Li
HMANet:用于图像超分辨率的混合多轴聚合网络
摘要

基于Transformer的方法在超分辨率视觉任务中表现出色,性能已超越传统的卷积神经网络。然而,现有方法通常将自注意力计算限制在非重叠窗口内,以降低计算开销。这一限制导致基于Transformer的网络只能利用有限空间范围内的输入信息,从而制约了其表达能力。为此,本文提出一种新型的混合多轴聚合网络(Hybrid Multi-Axis Aggregation network, HMA),旨在更充分地挖掘特征的潜在信息。HMA由堆叠的残差混合Transformer块(Residual Hybrid Transformer Block, RHTB)和网格注意力块(Grid Attention Block, GAB)构成。一方面,RHTB通过融合通道注意力与自注意力机制,增强非局部特征融合能力,从而生成更具视觉吸引力的输出结果;另一方面,GAB用于跨域信息交互,能够联合建模相似特征,扩展模型的感受野。在超分辨率任务的训练阶段,本文设计了一种新颖的预训练策略,进一步提升模型的表征能力,并通过大量实验验证了所提方法的有效性。实验结果表明,HMA在基准数据集上的表现优于当前最先进的方法。相关代码与模型已开源,地址为:https://github.com/korouuuuu/HMA。