8 天前

CascadedGaze:面向图像修复的全局上下文提取高效方法

Amirhosein Ghasemabadi, Muhammad Kamran Janjua, Mohammad Salameh, Chunhua Zhou, Fengyu Sun, Di Niu
CascadedGaze:面向图像修复的全局上下文提取高效方法
摘要

图像恢复任务传统上依赖于卷积神经网络(Convolutional Neural Networks, CNNs)。然而,由于卷积操作具有局部性特征,这类方法在捕捉全局信息方面存在局限。Transformer架构中引入的注意力机制虽有望克服这一瓶颈,但其带来的计算开销极为庞大。近年来,众多图像恢复研究致力于通过改进的Transformer结构,在性能与计算成本之间实现更优平衡。本文提出一种名为级联凝视网络(CascadedGaze Network, CGNet)的编码器-解码器架构,该架构引入了一种新颖且高效的全局上下文提取模块(Global Context Extractor, GCE),用于在图像恢复任务中有效捕获全局信息。GCE模块通过在卷积层中使用小尺寸卷积核来学习全局依赖关系,无需依赖自注意力机制。大量实验结果表明,所提出的计算高效方法在合成图像去噪和单幅图像去模糊任务上,性能可与多种先进方法相媲美;同时,在真实图像去噪任务中,进一步突破了现有方法的性能上限。

CascadedGaze:面向图像修复的全局上下文提取高效方法 | 最新论文 | HyperAI超神经