이미지 디헤이징을 위한 앙상블 다중 규모 잔차 주의력 네트워크(EMRA-net)
이미지 해징(Image dehazing)은 안개가 낀 이미지에서 청정 이미지를 복원하는 것을 목표로 하는 장기적으로 도전적인 문제이다. 본 논문에서는 직접 청정 이미지를 생성하는 데 목표를 둔, 다중 스케일 잔차 주의력 네트워크의 앙상블 구조인 EMRA-Net(Ensemble Multi-scale Residual Attention Network)을 제안한다. 제안된 EMRA-Net은 두 가지 주요 구성 요소로 이루어져 있다: 세 가지 스케일의 잔차 주의력 컨볼루션 신경망(TRA-CNN, Three-scale Residual Attention CNN)과 앙상블 주의력 컨볼루션 신경망(EA-CNN, Ensemble Attention CNN)이다. TRA-CNN에서는 일반적으로 사용되는 공간적 다운샘플링 방법(예: 가장 가까운 이웃 다운샘플링, 스태라이드 컨볼루션) 대신 웨이블릿 변환(Wavelet Transform)을 활용하여 다운샘플된 이미지를 생성한다. 웨이블릿 변환을 통해 이미지의 질감 세부 정보 손실을 효과적으로 방지할 수 있다. 또한 각 스케일 브랜치 내부에서는 Res2Net 모듈을 시리얼로 연결하여 원본 안개 이미지에서 추출한 계층적 특징을 최대한 활용하며, 채널 주의력 메커니즘(Channel Attention Mechanism)을 도입하여 채널 차원의 정보에 집중한다. 마지막으로, TRA-CNN에서 생성된 거친 이미지를 융합하여 정교한 청정 이미지를 생성하기 위해 EA-CNN을 제안한다. 기준 합성 안개 데이터셋과 실제 세계의 안개 이미지 데이터셋에 대한 광범위한 실험 결과를 통해, 제안한 EMRA-Net이 기존 최첨단 방법들에 비해 주관적 시각적 인식과 객관적 이미지 품질 평가 지표 측면에서 모두 우수한 성능을 보임을 입증하였다.