
초록
변분 오토인코더(Variational Autoencoders, VAEs)는 다양한 분야에 응용 가능한 강력한 가능도 기반 생성 모델 중 하나이다. 그러나 사전 분포로부터 온도 조절 없이 샘플을 추출할 경우, 특히 고해상도 이미지 생성에서 높은 품질의 결과를 도출하는 데 어려움을 겪는다. VAE의 생성 품질 저하에 대한 한 가지 설명은 '사전 공백 문제'(prior hole problem)이다. 이는 사전 분포가 집합적 근사 사후 분포와 일치하지 않음으로 인해 발생한다. 이러한 불일치로 인해 잠재 공간 내 사전 분포 하에서 높은 밀도를 가진 영역들이 실제로 인코딩된 이미지와 대응하지 않는 경우가 생기며, 이러한 영역에서 추출된 샘플은 왜곡된 이미지로 디코딩된다. 이 문제를 해결하기 위해, 기본 사전 분포와 재가중 요소의 곱으로 정의된 에너지 기반 사전을 제안한다. 이 재가중 요소는 기본 사전을 집합적 근사 사후 분포에 더 가깝게 만들도록 설계되었다. 재가중 요소는 노이즈 대조 추정(Noise Contrastive Estimation)을 통해 학습되며, 여러 잠재 변수 그룹을 가진 계층적 VAEs로도 일반화 가능하다. 실험 결과, 제안하는 노이즈 대조 사전이 MNIST, CIFAR-10, CelebA 64, CelebA HQ 256 데이터셋에서 최첨단 VAE 모델의 생성 성능을 크게 향상시킴을 확인하였다. 본 방법은 간단하며, 다양한 VAE 아키텍처에 적용 가능하여 사전 분포의 표현력을 효과적으로 향상시킬 수 있다.