9日前
PredRNN:時空間LSTMを用いた予測学習のための再帰型ニューラルネットワーク
{Jian-Min Wang, Philip S. Yu, Mingsheng Long, Zhifeng Gao, Yunbo Wang}

要約
時空間系列の予測学習は、過去のフレームから学習することで将来の画像を生成することを目的としており、空間的な外観と時間的な変化という2つの構造が重要な役割を果たす。本論文では、これらの構造をモデル化するため、予測用再帰型ニューラルネットワーク(PredRNN)を提案する。このアーキテクチャは、時空間予測学習において、空間的な外観と時間的な変化を統一的なメモリプールに記憶することが重要であるというアイデアに基づいている。具体的には、メモリ状態が各LSTMユニット内に制限されるのではなく、垂直方向に積み重ねられたRNN層を跨いで、水平方向にすべてのRNN状態を経由してジグザグに移動することが可能となる。このネットワークの核となるのは、空間的表現と時間的表現を同時に抽出・記憶できる新しい時空間LSTM(ST-LSTM)ユニットである。PredRNNは、3つの動画予測データセットにおいて最先端の予測性能を達成しており、他のアーキテクチャと統合することで、他の予測学習タスクへも容易に拡張可能なより汎用的なフレームワークである。