
초록
최근 몇 년간 생성적 적대 신경망(GAN)의 시각적 품질은 상당한 진전을 이뤘다. 그럼에도 불구하고, 이러한 네트워크는 주파수 영역에서의 고주파 성분에 대한 품질 저하 문제를 여전히 겪고 있으며, 이는 주파수적으로 편향된 아키텍처와 유사하게 불리한 손실 함수에서 비롯된다. 이 문제를 해결하기 위해, 주파수 영역에서 점진적인 생성을 구현하는 새로운 일반 목적의 스타일 및 웨이블릿 기반 GAN(SWAGAN)을 제안한다. SWAGAN은 생성자 및 판별자 아키텍처 전반에 걸쳐 웨이블릿을 통합하여, 모든 단계에서 주파수 인식(latent) 표현을 강제한다. 이러한 접근은 생성된 이미지의 시각적 품질을 향상시키고, 계산 성능도 크게 향상시킨다. 제안한 방법의 우수성을 입증하기 위해, SWAGAN을 StyleGAN2 프레임워크에 통합하여 웨이블릿 영역에서의 콘텐츠 생성이 더 현실적인 고주파 성분을 가진 고품질 이미지를 생성함을 검증하였다. 또한, 본 모델의 잠재 공간이 StyleGAN이 다양한 편집 작업의 기초가 될 수 있도록 하는 품질을 유지함을 확인하였으며, 주파수 인식 기반의 접근이 후속 시각적 품질에도 개선 효과를 초래함을 보였다.