
심층 생성 모델은 다중 모달 데이터 분포를 모델링하고 다양한 인간 행동을 특성화할 수 있다는 장점으로 인해 인간 운동 예측에 널리 사용된다. 비록 심층 생성 모델의 설계와 학습에 많은 노력을 기울이고 있지만, 훈련이 완료된 이후에 효율적으로 다양한 샘플을 생성하는 방법은 여전히 충분히 탐색되지 않은 문제이다. 기존의 생성형 인간 운동 예측 방법들은 대부분 사전 훈련된 생성 모델로부터 샘플을 얻기 위해 독립적인 가우시안 잠재 코드들을 추출한 후 이를 운동 샘플로 변환한다. 그러나 이러한 무작위 샘플링 전략은 두 가지 이유로 다양성이 보장되지 않는다: (1) 독립적인 샘플링은 샘플 간의 다양성을 강제할 수 없으며, (2) 샘플링은 단지 우도(likelihood)에 기반하기 때문에 데이터 분포의 주요 모드에 해당하는 샘플만 생성할 수 있다. 이러한 문제를 해결하기 위해, 사전 훈련된 심층 생성 모델로부터 다양한 샘플을 생성할 수 있는 새로운 샘플링 방법인 Diversifying Latent Flows (DLow)를 제안한다. 무작위(독립) 샘플링과 달리, 제안하는 DLow 샘플링 방법은 단일한 랜덤 변수를 샘플링한 후, 이를 학습 가능한 매핑 함수들을 통해 상관된 잠재 코드 집합으로 변환한다. 이 상관된 잠재 코드들은 이후에 상관된 샘플 집합으로 디코딩된다. 학습 과정에서는 샘플의 다양성을 촉진하는 사전 분포(prior)를 목적 함수로 사용하여 잠재 매핑을 최적화함으로써 샘플의 다양성을 향상시킨다. 이 사전 분포의 설계는 매우 유연하며, 동일한 특징(예: 유사한 다리 운동을 가지되 상체 운동은 다양함)을 공유하는 다양한 운동을 생성하도록 맞춤형으로 설정할 수 있다. 실험 결과 DLow는 샘플의 다양성과 정확성 측면에서 최신 기준 방법들을 모두 상회함을 보였다. 본 연구의 코드는 프로젝트 페이지에서 공개되었다: https://www.ye-yuan.com/dlow.