
초록
최근 생성 이미지 모델링 분야에서 많은 발전이 이루어졌음에도 불구하고, ImageNet과 같은 복잡한 데이터셋으로부터 고해상도의 다양하고 정교한 샘플을 성공적으로 생성하는 것은 여전히 달성하기 어려운 목표입니다. 이에 우리는 지금까지 시도된 가장 큰 규모로 생성적 적대 네트워크(Generative Adversarial Networks, GANs)를 훈련시키고, 이러한 규모에서 발생하는 특유의 불안정성을 연구하였습니다. 우리는 생성자(generator)에 직교 정규화(orthogonal regularization)를 적용하면 간단한 "절사 트릭(truncation trick)"을 사용할 수 있게 되어, 샘플의 충실성(fidelity)과 다양성(variety) 사이의 균형을 조절할 수 있다는 것을 발견하였습니다. 이는 생성자의 입력(input)의 분산(variance)을 줄임으로써 가능합니다. 우리의 수정 사항은 클래스 조건부 이미지 합성(class-conditional image synthesis)에서 새로운 최고 수준을 달성하는 모델들을 만들어냈습니다. 128x128 해상도로 ImageNet에서 훈련시킨 우리의 모델(BigGANs)은 Inception Score(IS) 166.5와 Frechet Inception Distance(FID) 7.4를 기록하여, 이전 최고 IS 52.52와 FID 18.6보다 크게 개선되었습니다.