2 个月前

使用时间核化自动编码器学习缺失数据的多变量时间序列表示

Filippo Maria Bianchi; Lorenzo Livi; Karl Øyvind Mikalsen; Michael Kampffmeyer; Robert Jenssen
使用时间核化自动编码器学习缺失数据的多变量时间序列表示
摘要

学习多变量时间序列(MTS)的压缩表示有助于在存在噪声和冗余信息的情况下进行数据分析,尤其是在变量数量和时间步长较多时。然而,经典的降维方法是为向量数据设计的,无法显式处理缺失值。在这项工作中,我们提出了一种基于循环神经网络的新颖自编码器架构,用于生成MTS的压缩表示。所提出的模型可以处理具有不同长度的输入,并且专门设计用于处理缺失数据。我们的自编码器学习固定长度的向量表示,这些表示之间的成对相似性与在输入空间中操作并处理缺失值的核函数对齐。这使得即使在存在大量缺失数据的情况下也能学习到良好的表示。为了展示所提方法的有效性,我们在多个分类任务中评估了所学表示的质量,包括涉及医疗数据的任务,并将其与其他降维方法进行了比较。随后,我们基于所提出的架构设计了两个框架:一个用于填补缺失数据,另一个用于单类分类。最后,我们分析了在什么情况下带有循环层的自编码器可以比前馈架构更好地学习MTS的压缩表示。

使用时间核化自动编码器学习缺失数据的多变量时间序列表示 | 最新论文 | HyperAI超神经