지속적 조건부 생성적 적대 신경망: 새로운 경험적 손실 함수 및 레이블 입력 메커니즘

이 연구에서는 연속적인 스칼라 조건(회귀 레이블이라 함)에 조건부로 이미지를 생성하는 최초의 생성 모델인 연속적 조건부 생성 적대 신경망(Continuous Conditional Generative Adversarial Network, CcGAN)을 제안한다. 기존의 조건부 GAN(cGAN)은 주로 범주형 조건(예: 클래스 레이블)을 위한 설계가 되어 있으며, 회귀 레이블에 조건부로 설정하는 것은 수학적으로 차별화되며 두 가지 근본적인 문제를 야기한다: (P1) 일부 회귀 레이블에 대해 실제 이미지가 매우 적거나 아예 없을 수 있으므로, 기존의 cGAN 손실 함수의 경험적 형태(이하 경험적 cGAN 손실)를 최소화하는 것은 실질적으로 실패하는 경우가 많다; (P2) 회귀 레이블은 스칼라이며 무한히 많은 수이므로, 기존의 레이블 입력 방식은 적용할 수 없다. 제안된 CcGAN은 위의 문제들을 각각 다음과 같이 해결한다: (S1) 기존의 경험적 cGAN 손실을 연속적 상황에 적합하도록 재정의함으로써; (S2) 생성기와 판별기 내부에 회귀 레이블을 통합하기 위해 간단한 레이블 입력(Naive Label Input, NLI) 방법과 개선된 레이블 입력(Improved Label Input, ILI) 방법을 제안함으로써. (S1)에서의 재정의는 각각 하드 비시널 판별기 손실(Hard Vicinal Discriminator Loss, HVDL)과 소프트 비시널 판별기 손실(Soft Vicinal Discriminator Loss, SVDL)이라는 두 가지 새로운 경험적 판별기 손실 및 하나의 새로운 경험적 생성기 손실을 도출한다. 본 연구에서는 HVDL 및 SVDL을 사용해 훈련된 판별기의 오차 한계를 비교적 약한 가정 하에서 도출하였다. 또한 본 연속적 상황을 위한 새로운 벤치마크 데이터셋 두 개(즉, RC-49 및 Cell-200)와 새로운 평가 지표(슬라이딩 프레셰 이너셉션 거리, Sliding Fréchet Inception Distance)도 제안하였다. 원형 2차원 가우시안, RC-49, UTKFace, Cell-200, 스티어링 각도 데이터셋에 대한 실험 결과, CcGAN은 주어진 회귀 레이블 조건 하에서 다양하고 고품질의 이미지를 생성할 수 있음을 보였다. 게다가, 이러한 실험에서 CcGAN은 시각적 및 정량적 측면 모두에서 기존의 cGAN보다 뚜렷한 성능 우위를 보였다.