
要約
低レベルビジョンタスクとしての画像強調は、さまざまなコンピュータビジョン応用に広く利用されている。近年、CNN、MLP、Transformerおよびフーリエ変換を組み合わせた複数の手法が、画像強調タスクにおいて有望な結果を達成している。しかし、これらの手法は精度と計算コストのバランスを十分に取れていない。本論文では、画像強調を信号変調問題として定式化し、波動的な特徴表現を用いて特徴表現力を向上させるWaveNetアーキテクチャを提案する。具体的には、フーリエ変換の発想に基づき、ピクセルを3つの波関数(コサイン波(CW)、サイン波(SW)、ゲーティング波(GW))による信号関数のサンプリング値として表現することを提案する。波動的特徴を生成するには、振幅と位相が必要である。振幅項は特徴の元の内容を含み、位相項は異なる入力と固定重みの間の関係を変調する。位相および振幅を動的に取得するために、波を適応的に生成し、波の重ね合わせモードを変調するWave Transform Block(WTB)を構築した。WTBを基盤として、画像強調に効果的なWaveNetアーキテクチャを構築した。6つの実世界データセットを用いた広範な実験により、本モデルが最先端手法と比較して優れた定量的・定性的な結果を達成することを示した。ソースコードおよび事前学習済みモデルは、https://github.com/DeniJsonC/WaveNet で公開されている。