11일 전

오미니-건: cGAN의 비밀과 그 이상

Peng Zhou, Lingxi Xie, Bingbing Ni, Cong Geng, Qi Tian
오미니-건: cGAN의 비밀과 그 이상
초록

조건부 생성적 적대 신경망(conditional generative adversarial network, cGAN)은 고품질 이미지를 생성하는 강력한 도구이지만, 기존의 접근 방식은 대부분 만족스럽지 않은 성능이나 모드 붕괴(mode collapse)의 위험에 노출되어 있다. 본 논문은 모델 훈련을 위한 적절한 판별자(discriminator) 설계에서 숨겨진 어려움을 드러내는 Omni-GAN이라는 cGAN의 변종을 제안한다. 핵심은 판별자가 개념을 정확히 인지할 수 있도록 강한 감독을 제공하면서도 붕괴를 방지하기 위해 적절한 정규화(regularization)를 유지하는 것이다. Omni-GAN은 구현이 간편하며, 즉시 사용 가능한 인코딩 방법(예: 은닉 신경 표현, INR)과 자유롭게 통합 가능하다. 실험을 통해 Omni-GAN과 Omni-INR-GAN이 다양한 이미지 생성 및 복원 작업에서 뛰어난 성능을 입증하였다. 특히 Omni-INR-GAN은 이미지 크기가 128과 256일 때 각각 262.85 및 343.22의 놀라운 Inception 점수를 기록하며 ImageNet 데이터셋에서 기존 기록을 100점 이상 초과하는 새로운 기록을 수립하였다. 또한, 생성자 사전 지식(generator prior)을 활용함으로써 Omni-INR-GAN은 저해상도 이미지를 임의의 해상도로 외삽할 수 있으며, 최대 x60 이상의 해상도로 확장하는 데 성공하였다. 코드는 공개되어 있다.

오미니-건: cGAN의 비밀과 그 이상 | 최신 연구 논문 | HyperAI초신경