
要約
自己監督型画像ノイズ除去は、真値にアクセスせずにノイジーな画像から信号を復元することを意味します。このタスクの最先端の解決策は、完全畳み込みニューラルネットワークを使用してマスクされたピクセルを予測することに依存しています。これには通常、複数回の順方向パス、ノイズモデルに関する情報、または複雑な正則化関数が必要です。本論文では、Swin Transformerに基づく画像オートエンコーダ(SwinIA)を提案します。これは、自己監督型ノイズ除去のための最初の完全トランスフォーマー構造です。注意メカニズムの柔軟性により、畳み込み型の手法が通常近似する盲点特性を満たすことができます。SwinIAは、単純な平均二乗誤差損失を使用してエンドツーエンドで訓練でき、クリーンデータやノイズ分布に関する事前知識を必要としません。使いやすく、SwinIAはいくつかの一般的なベンチマークで最先端の性能を達成しています。