Command Palette
Search for a command to run...
PredRNN : Réseaux de neurones récurrents pour l'apprentissage prédictif utilisant des LSTMs spatio-temporels
PredRNN : Réseaux de neurones récurrents pour l'apprentissage prédictif utilisant des LSTMs spatio-temporels
Yunbo Wang Mingsheng Long Jianmin Wang Zhifeng Gao Philip S. Yu
Résumé
L’apprentissage prédictif des séquences spatio-temporelles vise à générer des images futures à partir d’images historiques, où les structures spatiales et les variations temporelles constituent deux éléments fondamentaux. Ce papier modélise ces deux structures en proposant un réseau de neurones récurrents prédictif (PredRNN). Cette architecture s’inspire de l’idée selon laquelle l’apprentissage prédictif spatio-temporel doit mémoriser à la fois les apparences spatiales et les variations temporelles au sein d’un même espace mémoire. Plus précisément, les états mémoire ne sont plus restreints à l’intérieur de chaque unité LSTM. Au contraire, ils peuvent se propager selon deux directions : verticalement, à travers les couches empilées de réseaux RNN, et horizontalement, à travers tous les états RNN. Le cœur de ce réseau est une nouvelle unité Spatio-Temporelle LSTM (ST-LSTM), capable d’extraire et de mémoriser simultanément des représentations spatiales et temporelles. PredRNN atteint des performances prédictives de pointe sur trois jeux de données de prédiction vidéo et constitue un cadre plus général, facilement extensible à d’autres tâches d’apprentissage prédictif grâce à son intégration avec d’autres architectures.