
초록
생성적 적대 네트워크(GANs)는 이미지 합성 작업에서 큰 성공을 거두었지만, 훈련 중의 불안정성과 하이퍼파라미터에 대한 민감성으로 인해 다양한 데이터셋에 적용하는 것이 매우 어렵다는 점이 알려져 있습니다. 이 불안정성의 일반적으로 받아들여진 원인 중 하나는 실제 분포와 가짜 분포 사이에 충분한 겹침이 없을 때 판별기에서 생성기로 전달되는 그래디언트가 정보를 제공하지 않게 되는 것입니다. 본 연구에서는 이를 해결하기 위해 다중 스케일 그래디언트 생성적 적대 네트워크(MSG-GAN)를 제안합니다. 이 기법은 판별기에서 생성기로 그래디언트가 여러 스케일에서 흐르도록 하는 간단하면서도 효과적인 방법입니다. 이 기법은 고해상도 이미지 합성을 위한 안정적인 접근 방식을 제공하며, 일반적으로 사용되는 단계적 성장 기법의 대안으로 작용합니다. 우리는 MSG-GAN이 서로 다른 크기, 해상도, 도메인의 다양한 이미지 데이터셋과 다양한 손실 함수 및 아키텍처에서 동일한 고정된 하이퍼파라미터 세트로 안정적으로 수렴함을 보였습니다. 최신 GAN들과 비교했을 때, 우리의 접근 방식은 시도한 대부분의 경우에서 성능을 일치시키거나 초월하였습니다.