17일 전

CLR-GAN: 일관된 잠재 표현과 재구성을 통한 GAN의 안정성 및 품질 향상

{Shijie Luo and Shuzhen Han, Zhanshan Zhao, Ziqian Luan, Shengke Sun}
초록

생성적 적대망(GAN)은 이미지 생성 능력이 뛰어나다는 점에서 큰 주목을 받고 있다. 그러나 생성자(G)와 판별자(D) 사이의 게임이 공정하지 않기 때문에 GAN을 훈련하는 것은 어려운 과제이다. 이러한 불공정성을 완화하기 위해, 본 연구에서는 GAN 훈련에 대한 새로운 관점을 제안한다. 이를 '일관된 잠재 표현 및 재구성(CLR-GAN)'이라 명명한다. 본 프레임워크에서는 생성자(G)와 판별자(D)를 상호 역과정으로 간주한다. 이 과정에서 판별자는 사전 정의된 잠재 코드를 복원하는 추가적인 과제를 수행하며, 생성자 또한 실제 입력을 재구성해야 한다. 이를 통해 생성자 G의 잠재 공간과 판별자 D의 출력 특징 사이의 관계를 확보할 수 있다. 이러한 사전 지식을 바탕으로, 새로운 기준을 도입함으로써 훈련 과정에서 G와 D를 동등한 위치에 둘 수 있다. 다양한 데이터셋과 아키텍처에서의 실험 결과는 제안된 프레임워크가 GAN의 안정성을 높이고 더 높은 품질의 이미지를 생성함을 입증한다. 특히 CIFAR10에서는 FID 지표에서 31.22%의 개선, AFHQ-Cat에서는 39.5%의 개선을 달성하였다. 본 연구가 단순히 이중 플레이어 게임의 관점에 머무르지 않고, GAN 훈련을 다른 시각으로 탐구할 수 있는 계기를 마련하기를 기대한다. 코드는 공개되어 있으며, https://github.com/Petecheco/CLR-GAN 에서 확인할 수 있다.