17일 전

학습된 적응형 노이즈를 갖춘 확산 모델

Subham Sekhar Sahoo, Aaron Gokaslan, Chris De Sa, Volodymyr Kuleshov
학습된 적응형 노이즈를 갖춘 확산 모델
초록

확산 모델은 고품질 이미지 합성에 효과적인 알고리즘으로 주목받고 있다. 이러한 알고리즘의 핵심은 확산 과정으로, 데이터를 노이즈로 매핑하는 일련의 방정식으로, 성능에 상당한 영향을 미칠 수 있다. 본 논문에서는 확산 과정이 데이터로부터 학습될 수 있는지 탐구한다. 우리의 연구는 베이지안 추론에 기반하며, 학습된 확산 과정을 근사 변분 사후분포로 간주함으로써 로그 가능도 추정을 개선하고, 가능도에 대한 더 강한 하한(ELBO)을 도출하고자 한다. 기존에는 ELBO가 노이즈 과정에 대해 불변(invariant)하다는 널리 퍼진 가정이 있었으나, 본 연구는 이 가정을 부정하고, 이미지 내에서 서로 다른 속도로 노이즈를 적용하는 다변량 학습형 적응 노이즈(MULAN)를 제안한다. 구체적으로, 본 방법은 데이터에 대한 함수로서의 다변량 노이즈 스케줄을 활용하여, 기존 연구와 달리 ELBO가 노이즈 스케줄의 선택에 더 이상 불변하지 않도록 보장한다. 실험 결과, MULAN은 CIFAR-10 및 ImageNet에서 밀도 추정 성능에서 새로운 최고 기록을 수립하며, 훈련 단계 수를 50% 감소시켰다. 코드는 프로젝트 페이지에서 제공되며, 블로그 포스트와 동영상 튜토리얼도 함께 제공된다: https://s-sahoo.com/MuLAN

학습된 적응형 노이즈를 갖춘 확산 모델 | 최신 연구 논문 | HyperAI초신경