17일 전
소프트 디퓨전: 일반적인 손상에 대한 스코어 매칭
Giannis Daras, Mauricio Delbracio, Hossein Talebi, Alexandros G. Dimakis, Peyman Milanfar

초록
우리는 이전에 알려진 확산 모델을 일반화하는 더 넓은 종류의 왜곡 과정 가족을 정의한다. 이러한 일반화된 확산 과정을 역으로 복원하기 위해, 선형 왜곡 과정에 대해 점수 함수를 확실히 학습할 수 있는 새로운 목적 함수인 소프트 스코어 매칭(Soft Score Matching)을 제안한다. 이 방법은 CelebA에서 최고 수준의 성능을 달성한다. 소프트 스코어 매칭은 네트워크 내부에 왜곡 과정을 통합한다. 제안하는 새로운 손실 함수는, 왜곡된 후에 관측된 확산된 관측값과 일치하는 정제된 이미지를 예측하도록 모델을 학습시킨다. 우리는 적절한 정칙 조건 하에서, 이 목적 함수가 특정 왜곡 과정 가족에 대해 가능도의 기울기(gradient of the likelihood)를 학습함을 보인다. 또한 일반적인 확산 과정에 대해 왜곡 수준을 체계적으로 선택하는 방법과, 우리는 '모멘텀 샘플러(Momentum Sampler)'라고 부르는 새로운 샘플링 방법을 개발한다. 실험적으로, 본 프레임워크가 가우시안 블러와 마스킹과 같은 일반적인 선형 왜곡 과정에 대해 효과적으로 작동함을 입증한다. CelebA-64에서 FID 점수 1.85를 기록하며, 이는 이전의 모든 선형 확산 모델을 능가하는 최고 수준의 성능이다. 또한 일반적인 노이즈 제거 확산 모델 대비 상당한 계산 효율성의 이점을 보여준다.