17일 전

데이터 효율적인 인스턴스 생성: 인스턴스 구분을 통한 접근

Ceyuan Yang, Yujun Shen, Yinghao Xu, Bolei Zhou
데이터 효율적인 인스턴스 생성: 인스턴스 구분을 통한 접근
초록

생성적 적대 신경망(GANs)은 이미지 합성 분야에서 큰 발전을 이뤄냈으나, 훈련 데이터가 제한적일 경우 합성 품질이 크게 저하되는 문제가 존재한다. GAN 훈련의 데이터 효율성을 향상시키기 위해 기존 연구들은 일반적으로 데이터 증강을 활용하여 판별기(discriminator)의 과적합(overfitting)을 완화하면서도, 여전히 이진 분류(실제 대 위조) 작업을 통해 판별기를 학습한다. 본 연구에서는 인스턴스 구분(instance discrimination) 기반의 데이터 효율적인 인스턴스 생성(InsGen) 방법을 제안한다. 구체적으로, 실재 도메인과 위조 도메인을 구분하는 것 외에도, 훈련 데이터셋 또는 생성기에서 유래한 모든 개별 이미지를 서로 구분하도록 판별기를 요구한다. 이를 통해 판별기는 무한한 수의 생성된 샘플을 활용하여 훈련할 수 있게 되어, 훈련 데이터 부족으로 인한 과적합 문제를 완화할 수 있다. 더불어, 노이즈 편향 전략(noise perturbation strategy)을 도입하여 판별기의 구분 능력을 추가로 강화한다. 한편, 판별기가 학습한 인스턴스 구분 능력은 생성기의 다양성 있는 생성을 유도하는 데 활용된다. 광범위한 실험을 통해 제안한 방법이 다양한 데이터셋 및 훈련 환경에서 효과적임을 입증하였다. 특히 FFHQ 데이터셋에서 2,000개의 훈련 이미지만을 사용하는 설정에서, 기존 최고 성능 기법 대비 FID 지표에서 23.5% 향상을 달성하였다.