
본 논문에서는 생성적 적대 신경망(GAN)에서 발생하는 모드 붕괴(mode collapse) 문제를 해결하기 위한 새로운 접근 방식을 제안한다. 우리의 아이디어는 직관적이지만, 특히 GAN의 일부 핵심 한계를 극복하는 데 매우 효과적임이 입증되었다. 본질적으로, 쿨백-라이블러(KL) 발산과 역 KL 발산을 통합된 목적 함수로 결합함으로써, 이 두 발산이 가지는 보완적인 통계적 특성을 활용하여 다중 모드를 효과적으로 포착하는 추정 밀도의 다양성을 극대화한다. 본 방법을 이중 판별자 생성적 적대 신경망(Dual Discriminator Generative Adversarial Nets, D2GAN)이라 명명한다. 기존 GAN과 달리, D2GAN은 두 개의 판별자와 하나의 생성자로 구성되며, 이들은 미니맥스 게임과 유사한 구조를 갖는다. 하나의 판별자는 데이터 분포로부터 생성된 샘플에 대해 높은 점수를 부여하고, 반대로 다른 판별자는 생성자로부터 생성된 데이터를 선호하게 되며, 생성자는 두 판별자를 모두 속이도록 데이터를 생성한다. 우리는 이론적 분석을 통해, 최적의 판별자가 존재할 경우 D2GAN의 생성자 최적화가 데이터 분포와 생성자가 생성한 데이터로부터 유도되는 분포 사이의 KL 발산과 역 KL 발산을 동시에 최소화하는 것으로 수렴함을 보였다. 이는 모드 붕괴 문제를 효과적으로 회피할 수 있음을 의미한다. 우리는 합성 데이터 및 실세계 대규모 데이터셋(MNIST, CIFAR-10, STL-10, ImageNet)을 대상으로 광범위한 실험을 수행하였으며, 최신의 최상위 수준 GAN 변종들과의 포괄적인 정성적 및 정량적 비교를 최선을 다해 수행하였다. 실험 결과는 제안한 D2GAN이 기준 모델 대비 우수한 품질과 높은 다양성을 갖는 샘플을 생성하는 데 있어 경쟁력 있고 우수한 성능을 보임을 입증하였으며, ImageNet 데이터베이스와 같은 대규모 데이터셋에 확장 가능한 능력을 갖추고 있음을 확인하였다.