
초록
최근 생성적 적대 네트워크(Generative Adversarial Networks, GAN)는 비디오 생성 분야에서 유망한 결과를 보여주고 있으며, 이미지 생성의 성공을 바탕으로 새로운 도전 과제인 시간(time) 문제를 해결하고 있습니다. 초기 연구에서는 시간이 분석되었지만, 문헌은 시계열 모델링(temporal modeling) 발전에 충분히 발맞추지 못했습니다. 본 연구에서는 신경 미분 방정식(Neural Differential Equations, NDE)을 사용하여 비디오 생성의 시계열 역학(temporal dynamics)을 모델링하는 효과를 조사합니다. 신경 미분 방정식의 패러다임은 이론적인 강점이 많이 있으며, 비디오 생성 내에서 시간의 첫 번째 연속적 표현을 제공합니다. 신경 미분 방정식의 효과를 파악하기 위해, 시계열 모델의 변화가 생성된 비디오 품질에 어떻게 영향을 미치는지를 연구하였습니다. 우리의 결과는 더 오래된 시계열 생성기들을 단순히 대체할 수 있는 신경 미분 방정식의 사용을 지지합니다. 실행 시간은 유사하게 유지하면서 매개변수 개수를 줄였으며, 64×64 픽셀 무조건(unconditional) 비디오 생성에서 새로운 최첨단 모델(Inception Score 15.20)을 제시하였습니다.