
摘要
时间序列在许多分类/回归任务中被广泛用作信号。时间序列中普遍存在大量缺失值的情况。给定多个相关的时间序列数据,如何填补这些缺失值并预测其类别标签?现有的插补方法通常对底层数据生成过程施加强假设,例如状态空间中的线性动态。本文提出了一种基于循环神经网络(Recurrent Neural Networks, RNN)的新方法——BRITS,用于时间序列数据中缺失值的插补。我们提出的方法直接在一个双向循环动态系统中学习缺失值,无需任何特定假设。插补的值被视为RNN图中的变量,并可以在反向传播过程中有效更新。BRITS具有三个优势:(a) 能够处理时间序列中的多个相关缺失值;(b) 可以推广到具有非线性动态特性的时序数据;(c) 提供了一种数据驱动的插补程序,并适用于一般性的缺失数据场景。我们在三个真实世界的数据集上评估了我们的模型,包括空气质量数据集、医疗保健数据和人类活动定位数据。实验结果表明,我们的模型在插补和分类/回归准确性方面均优于现有最先进方法。