
摘要
自监督图像去噪是指在没有真实图像的情况下从噪声图像中恢复信号。目前该领域的最佳解决方案通常依赖于使用全卷积神经网络预测被遮掩的像素。这通常需要多次前向传递、噪声模型的信息或复杂的正则化函数。本文提出了一种基于Swin Transformer的图像自动编码器(SwinIA),这是首个用于自监督去噪的全Transformer架构。注意力机制的灵活性有助于实现卷积方法通常只能近似的盲点特性。SwinIA可以端到端地使用简单的均方误差损失进行训练,无需遮掩操作,也不需要任何关于干净数据或噪声分布的先验知识。SwinIA易于使用,并在多个常见的基准测试中建立了新的最先进水平。