2달 전

PFGM++: 물리학에서 영감을 받은 생성 모델의 잠재력 해방

Yilun Xu; Ziming Liu; Yonglong Tian; Shangyuan Tong; Max Tegmark; Tommi Jaakkola
PFGM++: 물리학에서 영감을 받은 생성 모델의 잠재력 해방
초록

우리는 물리학에서 영감을 받은 새로운 생성 모델 가족인 PFGM++를 소개합니다. 이 모델은 확산 모델과 포아송 유동 생성 모델(Poisson Flow Generative Models, PFGM)을 통합합니다. 이러한 모델은 $N$ 차원 데이터의 생성 경로를 $N{+}D$ 차원 공간에 임베딩하면서 여전히 $D$ 추가 변수의 간단한 스칼라 노름으로 진행을 제어합니다. 새로운 모델은 $D{=}1$일 때 PFGM으로, $D{\to}\infty$일 때 확산 모델로 축소됩니다. $D$ 선택의 유연성은 우리가 강건성을 강직성과 교환할 수 있게 하며, $D$를 증가시키면 데이터와 추가 변수 노름 사이의 결합이 더 집중됩니다. 우리는 PFGM에서 사용된 편향된 대규모 배치 필드 목표를 폐기하고 대신 확산 모델과 유사한 편향되지 않은 섭동 기반 목적함수를 제공합니다. 다양한 $D$ 선택을 탐색하기 위해, 우리는 확산 모델($D{\to} \infty$)에서 어떤 유한한 $D$ 값으로도 잘 조정된 하이퍼파라미터를 전송하는 직접 정렬 방법을 제공합니다. 우리의 실험 결과는 CIFAR-10/FFHQ $64{\times}64$ 데이터셋에서 $D{=}2048/128$일 때 FID 점수가 $1.91/2.43$인 것으로 나타나, 이는 기존 최고 성능의 확산 모델보다 우수함을 보여줍니다. 클래스 조건부 설정에서는 $D{=}2048$가 CIFAR-10에서 현재 최고 성능의 FID 점수인 $1.74$를 달성하였습니다. 또한, 작은 $D$ 값을 가진 모델이 모델링 오류에 대해 개선된 강건성을 보이는 것을 입증하였습니다. 코드는 https://github.com/Newbeeer/pfgmpp 에서 확인할 수 있습니다.

PFGM++: 물리학에서 영감을 받은 생성 모델의 잠재력 해방 | 최신 연구 논문 | HyperAI초신경