9 天前

SwinLSTM:利用Swin Transformer与LSTM提升时空预测精度

{RongNian Tang, Pu Zhang, Chuang Li, Song Tang}
SwinLSTM:利用Swin Transformer与LSTM提升时空预测精度
摘要

将卷积神经网络(CNN)与循环神经网络(RNN)相结合以捕捉时空依赖关系,是当前时空预测任务中的主流策略。然而,CNN擅长学习局部空间特征的特性,限制了其在捕捉复杂时空依赖关系方面的效率,从而制约了预测精度的提升。本文提出一种新型循环单元——SwinLSTM,该单元融合了Swin Transformer模块与简化的LSTM结构,其核心创新在于用自注意力机制替代ConvLSTM中的卷积结构。此外,我们构建了一个以SwinLSTM单元为核心组件的网络架构,用于时空预测任务。在不依赖特殊技巧的前提下,SwinLSTM在Moving MNIST、Human3.6M、TaxiBJ和KTH等多个基准数据集上均超越了当前最优方法。尤其值得注意的是,相较于ConvLSTM,SwinLSTM在预测精度上展现出显著提升。实验结果表明,学习全局空间依赖关系对模型捕捉时空动态具有更显著的优势。我们期望SwinLSTM能够成为推动时空预测性能提升的坚实基线方法。相关代码已公开发布于:https://github.com/SongTang-x/SwinLSTM。