11일 전

프로젝티드 GANs는 더 빠르게 수렴한다.

Axel Sauer, Kashyap Chitta, Jens Müller, Andreas Geiger
프로젝티드 GANs는 더 빠르게 수렴한다.
초록

생성적 적대 신경망(GAN)은 고해상도 이미지를 생성할 수 있지만, 학습이 어렵다. 정규화를 신중히 처리하고, 막대한 계산 자원을 필요로 하며, 비용이 많이 드는 하이퍼파라미터 탐색이 요구된다. 본 연구에서는 생성된 샘플과 실제 샘플을 고정된 사전 학습된 특징 공간에 투영함으로써 이 문제들에 대해 중요한 진전을 이룬다. 사전 학습된 모델의 깊은 계층에서 특징을 충분히 활용하지 못하는 현상을 바탕으로, 채널과 해상도 간의 특징을 혼합하는 더 효과적인 전략을 제안한다. 제안한 '프로젝션 GAN(Projected GAN)'은 이미지 품질, 샘플 효율성, 수렴 속도 측면에서 개선을 보였다. 또한 최대 1메가픽셀 해상도까지 호환 가능하며, 22개의 벤치마크 데이터셋에서 기존 최고 성능을 넘어서는 프레셰 인셉션 거리(Fréchet Inception Distance, FID)를 달성했다. 특히, 기존에 달성된 최저 FID 수치를 동일한 계산 자원을 사용할 때 40배 빠르게 도달할 수 있어, 벽시계 시간을 5일에서 3시간 미만으로 단축시켰다.

프로젝티드 GANs는 더 빠르게 수렴한다. | 최신 연구 논문 | HyperAI초신경