1ヶ月前

改善された条件付きVRNNを用いたビデオ予測

Lluis Castrejon; Nicolas Ballas; Aaron Courville
改善された条件付きVRNNを用いたビデオ予測
要約

ビデオシーケンスの将来フレームを予測することは、挑戦的な生成モデルのタスクです。有望なアプローチには、変分オートエンコーダ(Variational Auto-Encoder)などの確率的潜在変数モデルが含まれます。VAEは不確実性を扱い、複数の可能な未来の結果をモデル化することができますが、ぼやけた予測を生成する傾向があります。本研究では、これは適合不足の兆候であると主張します。この問題に対処するために、潜在分布の表現力を向上させ、より高い容量の尤度モデルを使用することを提案します。当方針は潜在変数の階層構造に依存しており、これにより将来シーケンスの確率をよりよくモデル化するための一連の柔軟な事前分布と事後分布を定義します。我々は一連の削除実験を通じて提案手法を検証し、現在の最先端の潜在変数モデルとの比較を行いました。当方法は3つの異なるデータセットにおいて複数の指標で好ましい性能を示しました。

改善された条件付きVRNNを用いたビデオ予測 | 最新論文 | HyperAI超神経