17일 전

점수 기반 확산 모델에서 구분자 안내를 통한 생성 과정의 정교화

Dongjun Kim, Yeongmin Kim, Se Jung Kwon, Wanmo Kang, Il-Chul Moon
점수 기반 확산 모델에서 구분자 안내를 통한 생성 과정의 정교화
초록

제안하는 방법인 디스커미네이터 가이던스(Discriminator Guidance)는 사전 훈련된 확산 모델의 샘플 생성 품질을 향상시키는 것을 목표로 한다. 이 방법은 노이즈 제거 샘플 경로가 실제적인지 여부에 대해 명시적인 감독을 제공하는 디스커미네이터를 도입한다. 기존의 GAN과 달리, 본 방법은 스코어 네트워크와 디스커미네이터 네트워크를 함께 훈련할 필요가 없다. 대신 스코어 훈련이 완료된 후 디스커미네이터를 별도로 훈련하므로, 디스커미네이터 훈련이 안정적이며 빠르게 수렴한다. 샘플 생성 과정에서는 사전 훈련된 스코어에 보조 항을 추가하여 디스커미네이터를 속이는 방식을 사용한다. 이 보조 항은 최적의 디스커미네이터에서 모델 스코어를 데이터 스코어로 보정하게 되며, 이는 디스커미네이터가 스코어 추정을 보완적으로 향상시키는 데 기여함을 시사한다. 본 알고리즘을 사용하여 ImageNet 256x256에서 FID 1.83, 리콜(recall) 0.64의 최신 기준(SOTA) 성과를 달성하였으며, 검증 데이터의 FID(1.68)와 리콜(0.66)과 유사한 수준이다. 코드는 https://github.com/alsdudrla10/DG 에 공개한다.