12 天前

TR-MISR:基于Transformer特征融合的多图像超分辨率

{Chunhong Pan, Lingfeng Wang, Bin Xue, Chunlei Huo, Xin Zhang, Tai An}
摘要

多图像超分辨率(Multiimage Super-Resolution, MISR)作为遥感领域最具前景的研究方向之一,已在卫星影像市场中展现出迫切的应用需求。卫星采集的一系列图像通常涵盖丰富的视角和较长的时间跨度,因此如何将多幅低分辨率图像融合为一幅具备细节的高分辨率图像,成为一个极具挑战性的问题。然而,现有的基于深度学习的MISR方法大多未能充分挖掘多幅图像的潜在信息,其融合模块难以有效适应时间相关性较弱的图像序列。为解决上述问题,本文提出一种全新的端到端框架——TR-MISR。该框架由三部分构成:基于残差块的编码器、基于Transformer的融合模块,以及基于子像素卷积的解码器。具体而言,该融合模块通过将多幅特征图重新排列为向量形式,能够对不同卫星图像中同一空间区域动态分配注意力,实现高效的信息整合。此外,TR-MISR引入一个可学习的嵌入向量,用于融合这些特征向量,从而最大程度地恢复图像细节。本方法首次成功将Transformer架构应用于MISR任务,通过忽略图像块之间的空间关系,显著降低了Transformer的训练难度。在PROBA-V Kelvin数据集上开展的大量实验表明,所提出的TR-MISR模型展现出显著优于现有方法的性能,不仅验证了其在MISR任务中的有效性,也为Transformer在其他低层视觉任务中的应用提供了有力参考。

TR-MISR:基于Transformer特征融合的多图像超分辨率 | 最新论文 | HyperAI超神经