
초록
본 논문에서는 하향식 판별망의 계층적 표현을 역으로 변환하도록 훈련된 새로운 생성 모델인 Stacked Generative Adversarial Networks (SGAN)를 제안합니다. 본 모델은 상향식 GAN 스택으로 구성되며, 각 GAN은 고차원 표현에 조건부로 저차원 표현을 생성하도록 학습됩니다. 각 특징 계층에서 표현 판별기를 도입하여 생성기의 표현 다양체가 하향식 판별망의 다양체와 일치하도록 유도하며, 강력한 판별적 표현을 활용하여 생성 모델을 안내합니다. 또한, 위 계층에서 조건부 정보를 사용하도록 장려하는 조건부 손실과 생성기 출력의 조건부 엔트로피에 대한 변분 하한을 최대화하는 새로운 엔트로피 손실을 도입합니다. 먼저 각 스택을 독립적으로 훈련시키고, 그 다음 전체 모델을 단일 시스템으로 훈련시킵니다. 원래 GAN이 모든 변화를 단일 노이즈 벡터로 나타내는 것과 달리, 우리의 SGAN은 변화를 여러 수준으로 분해하고 상향식 생성 과정에서 점진적으로 불확실성을 해소합니다. 시각 검사, Inception 점수 및 시각 Turing 테스트를 통해 SGAN이 스택 없이 GAN보다 훨씬 높은 품질의 이미지를 생성할 수 있음을 입증하였습니다.