9日前
Z-Order再帰型ニューラルネットワークを用いた動画予測
{Philip S Yu, Wang Jianmin, Mingsheng Long, Yunbo Wang, Jianjin Zhang}
要約
過去の観測データをもとに将来の動画フレームを予測するため、我々はZ-Order RNN(Znet)を提案する。本研究では、決定論的モデルと確率的モデルの観点からそれぞれ2つの主要な貢献がある。第一に、決定論的ダイナミクスをモデル化するための新たなRNNアーキテクチャを提案する。このアーキテクチャは、隠れ状態をZ曲線に沿って更新することで、鏡像層の特徴量の整合性を向上させる。第二に、確率的変動をモデル化するため、二ストリームZnetにおける敵対的学習アプローチを導入する。この手法は、Znet-PredictorがZnet-Probeの挙動を模倣するよう強制する。この二ストリーム構造により、敵対的学習を画像空間ではなく特徴空間で実行可能となる。本モデルは、2つの動画データセットにおいて最先端の予測精度を達成した。