2ヶ月前
KBNet: カーネルベースネットワークによる画像復元
Zhang, Yi ; Li, Dasong ; Shi, Xiaoyu ; He, Dailan ; Song, Kangning ; Wang, Xiaogang ; Qin, Hongwei ; Li, Hongsheng

要約
空間情報の集約方法は、学習ベースの画像復元において重要な役割を果たします。既存のCNN(畳み込みニューラルネットワーク)に基づくネットワークは、静的な畳み込みカーネルを使用して空間情報を符号化していますが、これは適応的に空間情報を集約することができません。最近のトランスフォーマーに基づくアーキテクチャでは、適応的な空間集約が達成されています。しかし、これらのアーキテクチャは畳み込みの望ましい帰納的バイアスに欠けており、重い計算コストが必要です。本論文では、学習可能なカーネルベースを導入して代表的な画像パターンをモデル化し、空間情報を集約するためのカーネルベース注意(KBA)モジュールを提案します。異なるカーネルベースは異なる局所構造をモデル化するために訓練されます。各空間位置では、予測された画素単位の係数によって線形かつ適応的に融合され、集約ウェイトが得られます。KBAモジュールに基づいて、さらに多軸特徴融合(MFF)ブロックを設計しました。このブロックはチャンネル単位の特徴、空間不変性特徴、および画素適応特徴を符号化し融合することで画像復元を行います。我々のモデルであるカーネルベースネットワーク(KBNet)は、画像ノイズ除去、雨除去、以及ぼれ除去タスクにおいて10以上のベンチマークで最先端の性能を達成しており、以前のSOTA手法よりも少ない計算コストで動作します。