HyperAIHyperAI

Command Palette

Search for a command to run...

HMANet:用于图像超分辨率的混合多轴聚合网络

Shu-Chuan Chu Zhi-Chao Dou Jeng-Shyang Pan Shaowei Weng Junbao Li

摘要

基于Transformer的方法在超分辨率视觉任务中表现出色,性能已超越传统的卷积神经网络。然而,现有方法通常将自注意力计算限制在非重叠窗口内,以降低计算开销。这一限制导致基于Transformer的网络只能利用有限空间范围内的输入信息,从而制约了其表达能力。为此,本文提出一种新型的混合多轴聚合网络(Hybrid Multi-Axis Aggregation network, HMA),旨在更充分地挖掘特征的潜在信息。HMA由堆叠的残差混合Transformer块(Residual Hybrid Transformer Block, RHTB)和网格注意力块(Grid Attention Block, GAB)构成。一方面,RHTB通过融合通道注意力与自注意力机制,增强非局部特征融合能力,从而生成更具视觉吸引力的输出结果;另一方面,GAB用于跨域信息交互,能够联合建模相似特征,扩展模型的感受野。在超分辨率任务的训练阶段,本文设计了一种新颖的预训练策略,进一步提升模型的表征能力,并通过大量实验验证了所提方法的有效性。实验结果表明,HMA在基准数据集上的表现优于当前最先进的方法。相关代码与模型已开源,地址为:https://github.com/korouuuuu/HMA


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供