9일 전

비디오 예측을 위한 음성 스택형 자기회귀 모델

Minseok Seo, Hakjin Lee, Doyi Kim, Junghoon Seo
비디오 예측을 위한 음성 스택형 자기회귀 모델
초록

미래 프레임 예측은 주로 자기회귀적(auto-regressive) 및 비자기회귀적(non-auto-regressive) 두 가지 주요 방법을 통해 접근되어 왔다. 자기회귀적 방법은 마르코프 가정(markov assumption)에 기반하며, 오차가 누적되기 전 초기 예측 단계에서는 높은 정확도를 달성할 수 있다. 그러나 시간 단계가 증가함에 따라 성능이 저하되는 경향이 있다. 반면 비자기회귀적 방법은 상대적으로 높은 성능을 보일 수 있으나, 각 시간 단계에 대한 예측 간의 상관관계가 부족하다는 한계가 있다. 본 논문에서는 비자기회귀적 접근 방식과 유사하게 동일한 관측 프레임을 활용하여 모든 미래 프레임을 추정하지만, 자기회귀적 방법과 유사하게 자신의 예측 결과를 입력으로 사용하는 암묵적 스택형 자기회귀 모델(Implicit Stacked Autoregressive Model for Video Prediction, IAM4VP)을 제안한다. 시간 단계가 증가함에 따라 예측 결과는 차례로 큐에 스택된다. IAM4VP의 효과성을 평가하기 위해, 일반적인 미래 프레임 예측 벤치마크 데이터셋 3종과 기상 및 기후 예측 벤치마크 데이터셋에서 실험을 수행하였다. 실험 결과, 제안하는 모델이 최신 기술(state-of-the-art) 수준의 성능을 달성함을 입증하였다.

비디오 예측을 위한 음성 스택형 자기회귀 모델 | 최신 연구 논문 | HyperAI초신경