
초록
최근 생성적 적대 신경망(GAN) 기술의 발전으로 인해 고해상도의 합성 이미지를 생성하는 데 널리 활용되고 있다. 이러한 모델은 사진처럼 사실적인 이미지를 생성할 수 있지만, 데이터의 기저 다양체(manifold)를 벗어난 비현실적인 샘플을 종종 생성한다. 최근 제안된 여러 기법들은 이러한 부정확한 샘플을 생성 후 거부하거나, 모델의 잠재 공간(latent space)을 절단함으로써 이를 회피하려 한다. 비록 이러한 방법들은 효과적이지만, 생성된 샘플 중 다수는 결국 사용되지 않기 때문에, 훈련 시간과 모델 용량의 상당 부분이 낭비되는 비효율적인 문제를 안고 있다. 본 연구에서는 샘플 품질을 향상시키기 위한 새로운 접근 방식을 제안한다. 즉, 모델 훈련 전에 데이터셋을 인스턴스 선택(instance selection)을 통해 개선하는 방식이다. 훈련 전에 경험적 데이터 분포를 정제함으로써, 모델의 능력이 고밀도 영역에 집중되도록 유도함으로써, 최종적으로 샘플의 정확도를 높이고, 모델 용량 요구를 낮추며, 훈련 시간을 크게 단축할 수 있다. 코드는 다음 링크에서 확인할 수 있다: https://github.com/uoguelph-mlrg/instance_selection_for_gans.