Command Palette
Search for a command to run...
PredRNN:時空間LSTMを用いた予測学習のための再帰型ニューラルネットワーク
PredRNN:時空間LSTMを用いた予測学習のための再帰型ニューラルネットワーク
Yunbo Wang Mingsheng Long Jianmin Wang Zhifeng Gao Philip S. Yu
概要
時空間系列の予測学習は、過去のフレームから学習することで将来の画像を生成することを目的としており、空間的な外観と時間的な変化という二つの構造が重要な役割を果たす。本論文では、これらの構造をモデル化するため、予測型再帰型ニューラルネットワーク(PredRNN)を提案する。このアーキテクチャの設計は、時空間予測学習において、空間的な外観と時間的な変化を統一されたメモリプールに記憶する必要があるというアイデアにインスパイアされている。具体的には、メモリ状態が各LSTMユニット内に制約されるのではなく、垂直方向に積み重ねられたRNN層を跨いで、水平方向にすべてのRNN状態を経由して「ジグザグ」に移動することを許容する。このネットワークの核となるのは、空間的表現と時間的表現を同時に抽出・記憶する新しい時空間LSTM(ST-LSTM)ユニットである。PredRNNは、3つの動画予測データセットにおいて、最先端の予測性能を達成しており、他のアーキテクチャと統合することで、他の予測学習タスクにも容易に拡張可能なより汎用的なフレームワークである。