6 个月前

卷积神经网络

计算机视觉

计算机视觉

Shu-Chuan Chu Zhi-Chao Dou Jeng-Shyang Pan Shaowei Weng Junbao Li

摘要

基于Transformer的方法在超分辨率视觉任务中表现出色，性能已超越传统的卷积神经网络。然而，现有方法通常将自注意力计算限制在非重叠窗口内，以降低计算开销。这一限制导致基于Transformer的网络只能利用有限空间范围内的输入信息，从而制约了其表达能力。为此，本文提出一种新型的混合多轴聚合网络（Hybrid Multi-Axis Aggregation network, HMA），旨在更充分地挖掘特征的潜在信息。HMA由堆叠的残差混合Transformer块（Residual Hybrid Transformer Block, RHTB）和网格注意力块（Grid Attention Block, GAB）构成。一方面，RHTB通过融合通道注意力与自注意力机制，增强非局部特征融合能力，从而生成更具视觉吸引力的输出结果；另一方面，GAB用于跨域信息交互，能够联合建模相似特征，扩展模型的感受野。在超分辨率任务的训练阶段，本文设计了一种新颖的预训练策略，进一步提升模型的表征能力，并通过大量实验验证了所提方法的有效性。实验结果表明，HMA在基准数据集上的表现优于当前最先进的方法。相关代码与模型已开源，地址为：https://github.com/korouuuuu/HMA。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

计算机视觉

Shu-Chuan Chu Zhi-Chao Dou Jeng-Shyang Pan Shaowei Weng Junbao Li

摘要

基于Transformer的方法在超分辨率视觉任务中表现出色，性能已超越传统的卷积神经网络。然而，现有方法通常将自注意力计算限制在非重叠窗口内，以降低计算开销。这一限制导致基于Transformer的网络只能利用有限空间范围内的输入信息，从而制约了其表达能力。为此，本文提出一种新型的混合多轴聚合网络（Hybrid Multi-Axis Aggregation network, HMA），旨在更充分地挖掘特征的潜在信息。HMA由堆叠的残差混合Transformer块（Residual Hybrid Transformer Block, RHTB）和网格注意力块（Grid Attention Block, GAB）构成。一方面，RHTB通过融合通道注意力与自注意力机制，增强非局部特征融合能力，从而生成更具视觉吸引力的输出结果；另一方面，GAB用于跨域信息交互，能够联合建模相似特征，扩展模型的感受野。在超分辨率任务的训练阶段，本文设计了一种新颖的预训练策略，进一步提升模型的表征能力，并通过大量实验验证了所提方法的有效性。实验结果表明，HMA在基准数据集上的表现优于当前最先进的方法。相关代码与模型已开源，地址为：https://github.com/korouuuuu/HMA。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供