물리 인식 단일 이미지 화이트닝을 위한 교육과정 대비 정규화

일반적으로 단일 이미지 흐림 제거 문제는 정의되지 않은 문제(ill-posed) 성격을 가지며, 대조 정규화(contrastive regularization) 기법이 이를 해결하기 위해 제안되었다. 이 기법은 음성 이미지(negative images)로부터의 정보를 하한 경계(lower bound)로 도입함으로써 성능을 향상시키고자 한다. 그러나 기존의 대조 샘플은 일관성 없는(non-consensual) 특성을 가지며, 음성 샘플이 일반적으로 맑은 이미지(즉, 양성 이미지)로부터 멀리 떨어져 표현되기 때문에, 해의 공간은 여전히 제약이 부족한 상태로 남아 있다. 또한, 딥 흐림 제거 모델의 해석 가능성은 흐림 과정의 물리적 메커니즘에 대한 이해가 부족한 상태로 여전히 탐색되지 않았다. 본 논문에서는 기존의 비일관성 있는 대조 공간이 아닌, 일관성 있는 대조 공간을 목표로 하는 새로운 교육적 대조 정규화(curricular contrastive regularization)를 제안한다. 제안하는 음성 샘플은 1) 흐린 이미지 자체와 2) 기존 기법들에 의해 복원된 결과물들로부터 구성되며, 이는 더 나은 하한 경계 제약을 제공한다. 또한, 맑은 이미지의 임베딩과 음성 샘플 간의 유사성 차이로 인해 다중 구성 요소의 학습 난이도가 본질적으로 불균형하게 나타난다. 이를 해결하기 위해, 다양한 음성 샘플의 중요도를 재가중하는 교육 전략(curriculum learning strategy)을 맞춤형으로 설계하였다. 더불어, 특징 공간 내 해석 가능성 향상을 위해 대기 산란 모델(atmospheric scattering model)을 기반으로 한 물리적 인지형 이중 분기 유닛(physically-aware dual-branch unit)을 구축하였다. 이러한 유닛과 교육적 대조 정규화를 결합하여, C2PNet이라는 새로운 흐림 제거 네트워크를 설계하였다. 광범위한 실험 결과를 통해 C2PNet이 최신 기법들에 비해 뛰어난 성능을 보였으며, SOTS-indoor 및 SOTS-outdoor 데이터셋에서 각각 3.94dB와 1.50dB의 극단적인 PSNR 향상 효과를 기록하였다.