2달 전

EMDM: 효율적인 모션 확산 모델을 이용한 빠르고 고품질의 모션 생성

Zhou, Wenyang ; Dou, Zhiyang ; Cao, Zeyu ; Liao, Zhouyingcheng ; Wang, Jingbo ; Wang, Wenjia ; Liu, Yuan ; Komura, Taku ; Wang, Wenping ; Liu, Lingjie
EMDM: 효율적인 모션 확산 모델을 이용한 빠르고 고품질의 모션 생성
초록

우리는 빠르고 고품질의 인간 운동 생성을 위한 효율적인 운동 확산 모델(Efficient Motion Diffusion Model, EMDM)을 소개합니다. 현재 최신의 생성 확산 모델들은 인상적인 결과를 내놓았지만, 품질을 저하시키지 않으면서 빠른 생성을 달성하는 데 어려움이 있습니다. 한편으로는 이전 연구들, 예를 들어 운동 잠재 확산 모델은 효율성을 위해 잠재 공간에서 확산을 수행하지만, 이러한 잠재 공간을 학습하는 것은 복잡한 작업일 수 있습니다. 다른 한편으로는 샘플링 스텝 크기를 단순히 증가시켜 생성 속도를 높이는 방법(예: DDIM)은 복잡한 노이즈 제거 분포를 근사화하지 못해 품질 저하를 초래할 수 있습니다.이러한 문제들을 해결하기 위해 우리는 EMDM을 제안합니다. EMDM은 확산 모델에서 여러 샘플링 스텝 동안 복잡한 분포를 포착하여, 훨씬 적은 샘플링 스텝과 함께 상당한 가속화를 실현합니다. 이는 제어 신호에 조건부로 임의의 (그리고 잠재적으로 더 큰) 스텝 크기 사이에서 다중모드 데이터 분포를 포착하는 조건부 노이즈 제거 확산 GAN(Generative Adversarial Network)을 통해 이루어집니다. 이를 통해 적은 스텝으로도 고품질과 다양성을 유지하면서 운동 샘플링이 가능해집니다. 또한 불필요한 운동 아티팩트를 최소화하기 위해 네트워크 학습 중 기하학적 손실이 부과됩니다.결과적으로, EMDM은 실시간 운동 생성을 달성하며, 기존 방법들보다 운동 확산 모델의 효율성을 크게 개선하면서 고품질의 운동 생성을 실현합니다. 우리의 코드는 출판 시 공개될 예정입니다.

EMDM: 효율적인 모션 확산 모델을 이용한 빠르고 고품질의 모션 생성 | 최신 연구 논문 | HyperAI초신경