
要約
カメラのボケ(ディフォーカス)によって生じるぼやけアーティファクトに対処するため、二重ピクセル画像を用いた深層畳み込みニューラルネットワーク(CNN)を提案する。具体的には、各二重ピクセル画像から有用な情報を効果的に抽出し、それぞれの画像から有用な情報を選別して最終出力画像を合成するため、アテンションエンコーダ、トリプルローカルモジュールおよびグローバルローカルモジュールから構成される二重アテンションネットワークを設計した。本研究では、NTIRE 2021 二重ピクセル画像を用いたディフォーカスデブラーイングチャレンジのテストセットを用いて、定性的および定量的な観点から提案手法の有効性を検証した。実装コードおよび学習済みモデルは、https://github.com/tuvovan/ATTSF にて公開されている。