품질 무관 이미지 인식을 위한 역행 가능 디코더 기반 방법

이미지 인식 과제에서 딥 모델은 뛰어난 성능을 보이지만, 흐림, 노이즈, 저해상도와 같은 일반적인 손상(corruption)에 취약하다는 점이 알려져 있다. 데이터 증강(data augmentation)은 이러한 일반적인 손상을 학습 과정에서 고려함으로써 강건한 모델을 구축하는 전통적인 방법이다. 그러나 단순한 데이터 증강 전략은 모델이 다양한 손상 간의 평균 분포를 학습하게 되어 특정 손상에 대해 특화되지 않은 모델이 되는 문제를 야기할 수 있다. 이를 해결하기 위해, 어떤 품질의 이미지에서도 깨끗한 이미지와 유사한 특징을 생성할 수 있도록 하는 역가능(invertible) 신경망 아키텍처를 활용한 새로운 딥 이미지 인식 네트워크 학습 프레임워크를 제안한다. 제안하는 방법은 두 단계로 구성된다. 첫 번째 단계에서는 인식 목적(function)을 기반으로 단지 깨끗한 이미지만을 사용하여 역가능 네트워크를 학습한다. 두 번째 단계에서는 첫 번째 단계에서 학습된 역가능 네트워크의 역함수, 즉 역가능 디코더(invertible decoder)를 새로운 인식 네트워크에 연결하고, 깨끗한 이미지와 손상된 이미지를 모두 사용하여 인식 및 재구성 목적을 고려해 인코더-디코더 네트워크를 학습한다. 본 연구의 이중 단계 학습 전략은 역가능 디코더를 통해 손상된 이미지를 깨끗한 이미지로 재구성함으로써, 어떤 품질의 이미지에서도 깨끗한 이미지와 유사하고 강건한 특징을 생성할 수 있도록 한다. 제안한 방법의 효과는 이미지 분류 및 얼굴 인식 과제에서 검증되었다.