16일 전

확산 모델, 이미지 합성에서 GAN을 능가한다

Prafulla Dhariwal, Alex Nichol
확산 모델, 이미지 합성에서 GAN을 능가한다
초록

우리는 확산 모델이 현재 최고 수준의 생성 모델보다 우수한 이미지 샘플 품질을 달성할 수 있음을 보여줍니다. 무조건적 이미지 생성에서는 일련의 추상화(ablation) 실험을 통해 더 우수한 아키텍처를 찾음으로써 이를 달성하였습니다. 조건부 이미지 생성의 경우, 분류기 유도(classifier guidance)를 추가하여 샘플 품질을 더욱 향상시켰습니다. 분류기의 기울기(gradient)를 활용하여 다양성과 정확성 사이의 균형을 효율적으로 조절할 수 있는 간단하고 계산 비용이 낮은 방법입니다. ImageNet 128×128에서는 FID 2.97, 256×256에서는 4.59, 512×512에서는 7.72의 성능을 달성하였으며, 샘플당 단 25회 전방 전파(forward pass)만으로도 BigGAN-deep와 동등한 성능을 유지하면서도 분포의 더 넓은 커버리지(coverage)를 유지하였습니다. 마지막으로, 분류기 유도가 업샘플링 확산 모델과 잘 결합됨을 발견하였으며, 이로 인해 ImageNet 256×256에서 FID를 3.94로, 512×512에서는 3.85로 further 개선하였습니다. 본 연구의 코드는 https://github.com/openai/guided-diffusion 에서 공개합니다.

확산 모델, 이미지 합성에서 GAN을 능가한다 | 최신 연구 논문 | HyperAI초신경