9日前

動画予測のための暗黙的スタック型自己回帰モデル

Minseok Seo, Hakjin Lee, Doyi Kim, Junghoon Seo
動画予測のための暗黙的スタック型自己回帰モデル
要約

未来フレーム予測は、主に自己回帰型(autoregressive)と非自己回帰型(non-autoregressive)の2つのアプローチによって扱われてきました。自己回帰型手法はマルコフ仮定に依拠しており、誤差が蓄積する前の初期段階では高い精度を達成できますが、時間ステップ数が増えるにつれて性能が低下する傾向があります。一方、非自己回帰型手法は比較的高い性能を発揮できますが、各時間ステップにおける予測間の相関性に欠けます。本論文では、動画予測を目的とした「暗黙的スタック自己回帰モデル」(Implicit Stacked Autoregressive Model for Video Prediction, IAM4VP)を提案します。これは、スタック自己回帰手法を採用した暗黙的動画予測モデルであり、非自己回帰型手法と同様に、すべての未来フレームの推定に同一の観測フレームを用います。しかし、自己回帰型手法と同様に、自身の予測結果を入力として再利用します。時間ステップが増えるに従い、予測結果は順次キューに積み重ねられていきます。IAM4VPの有効性を検証するため、3つの一般的な未来フレーム予測ベンチマークデータセットおよび気象・気候予測ベンチマークデータセットを用いた実験を実施しました。その結果、提案モデルが最先端の性能を達成することが示されました。

動画予測のための暗黙的スタック型自己回帰モデル | 最新論文 | HyperAI超神経