11일 전

인간 운동 확산 모델

Guy Tevet, Sigal Raab, Brian Gordon, Yonatan Shafir, Daniel Cohen-Or, Amit H. Bermano
인간 운동 확산 모델
초록

자연스럽고 표현력 있는 인간 운동 생성은 컴퓨터 애니메이션 분야의 최종 목표로 여겨진다. 이는 가능한 운동의 다양성, 인간의 운동에 대한 높은 인지 민감도, 그리고 그를 정확히 기술하는 어려움으로 인해 매우 도전적인 과제이다. 따라서 현재의 생성 기법들은 품질이 낮거나 표현력이 제한적이다. 이미 다른 분야에서 뛰어난 생성 능력을 보여준 확산 모델(.Diffusion models)은 인간 운동 생성에 있어 다대다(many-to-many) 특성을 가진다는 점에서 유망한 후보이지만, 자원을 많이 소비하고 제어하기 어렵다는 단점이 있다. 본 논문에서는 인간 운동 영역에 특화된 분류기 없는 확산 기반 생성 모델인 Motion Diffusion Model(MDM)을 제안한다. MDM은 트랜스포머 기반으로, 기존 운동 생성 연구에서 얻은 통찰을 통합한 설계를 채택하였다. 주목할 만한 설계 선택은 각 확산 단계에서 노이즈가 아닌 샘플 자체를 예측하는 것이다. 이는 운동의 위치와 속도에 대해 기존에 잘 정립된 기하학적 손실(Geometric Losses), 예를 들어 발 접지 손실(Foot Contact Loss) 등을 효과적으로 활용할 수 있게 한다. 우리는 MDM이 일반적인 접근 방식임을 입증하며, 다양한 조건부 입력 방식과 다양한 생성 작업을 지원함을 보여준다. 또한, 가벼운 자원으로 훈련됨에도 불구하고, 텍스트에서 운동으로(Text-to-Motion) 및 동작에서 운동으로(Action-to-Motion) 전환을 위한 주요 벤치마크에서 최상의 성능을 달성함을 보여준다.https://guytevet.github.io/mdm-page/

인간 운동 확산 모델 | 최신 연구 논문 | HyperAI초신경