단일 단계 적응형 다중 주의망을 통한 이미지 복원
최근 주의 기반 네트워크는 이미지 복원 작업에서 성공을 거두고 있다. 그러나 기존의 방법들은 계산 비용이 높거나 수용 필드가 제한적이어서 모델에 제약을 가한다. 또한 공간적 및 맥락적 측면에서의 회복력이 낮고, 픽셀 간 일대일 대응이 부족하여 특징 표현의 품질이 저하될 수 있다. 본 논문에서는 이미지 복원, 특히 이미지 노이즈 제거 및 블러 제거 작업을 위한 새로운 계산 효율적인 아키텍처인 Single Stage Adaptive Multi-Attention Network(이하 SSAMAN)을 제안한다. SSAMAN은 계산적 도전 과제를 효율적으로 해결하고 수용 필드를 확장함으로써 공간적 및 맥락적 특징 표현의 강건성을 향상시킨다. 본 모델의 핵심인 Adaptive Multi-Attention Module(AMAM)은 Adaptive Pixel Attention Branch(APAB)와 Adaptive Channel Attention Branch(ACAB)로 구성되며, 채널 차원과 픽셀 차원을 독창적으로 통합하여 가장자리, 형태, 질감에 대한 민감도를 크게 향상시킨다. 우리는 SSAMAN의 성능을 검증하기 위해 광범위한 실험 및 아블레이션 스터디를 수행하였다. 제안된 모델은 다양한 벤치마크에서 최첨단 성능을 보였으며, 이미지 노이즈 제거 작업에서 SIDD 데이터셋에서 40.08 dB의 PSNR를 달성하여 Restormer보다 0.06 dB 높은 성능을 기록하면서도 계산 비용은 41.02% 감소시켰고, DND 데이터셋에서는 40.05 dB의 PSNR를 달성하였다. 이미지 블러 제거 작업에서는 GoPro 데이터셋에서 33.53 dB의 PSNR를 기록하였다. 코드 및 모델은 GitHub에서 공개되어 있다.