17 天前

DeblurDiNAT:一种在未见领域上具备卓越泛化能力与视觉保真度的紧凑模型

Hanzhou Liu, Binghan Li, Chengkai Liu, Mi Lu
DeblurDiNAT:一种在未见领域上具备卓越泛化能力与视觉保真度的紧凑模型
摘要

近年来,去模糊网络在从模糊图像中恢复清晰图像方面取得了显著进展。然而,这些方法在面对未知域时往往表现出较差的泛化能力。此外,现有模型通常仅关注PSNR、SSIM等客观失真度量,忽视了与人类视觉感知更为契合的主观评价指标。为解决上述局限,本文提出一种基于空洞邻域注意力(Dilated Neighborhood Attention)的去模糊Transformer——DeblurDiNAT。首先,DeblurDiNAT引入交替空洞率机制,有效捕捉局部与全局的模糊模式,从而提升模型的泛化能力与感知清晰度。其次,设计了一种局部跨通道学习器,辅助Transformer模块建模相邻通道间的短程依赖关系。此外,本文提出一种结构简洁而高效的线性前馈网络。最后,引入一种双阶段特征融合模块,替代传统方法,以更高效地处理网络不同层级间的多尺度视觉信息。实验结果表明,相较于当前最先进的模型,本方法在保持紧凑模型规模的同时,展现出更强的泛化能力,并在感知质量指标上取得了显著提升。