
摘要
如今,多传感器技术已广泛应用于多个领域,例如健康医疗(Health Care, HC)、人体活动识别(Human Activity Recognition, HAR)以及工业控制系统(Industrial Control System, ICS)。这些传感器能够生成大量多变量时间序列数据。在机器学习研究中,对多传感器时间序列数据进行无监督异常检测已被证明具有重要意义。其核心挑战在于,如何通过捕捉多传感器数据中的时空相关性,发现具有泛化能力的正常模式。此外,训练数据中常混杂着噪声数据,这容易误导模型,使其难以准确区分正常、异常与噪声数据。然而,以往的研究很少能同时应对上述两个挑战。本文提出一种基于深度学习的新型异常检测算法——深度卷积自编码记忆网络(Deep Convolutional Autoencoding Memory network, CAE-M)。首先,我们构建一个深度卷积自编码器(Deep Convolutional Autoencoder),利用最大均值差异(Maximum Mean Discrepancy, MMD)来表征多传感器数据的空间依赖性,从而更有效地识别噪声、正常与异常数据。其次,我们设计了一种记忆网络(Memory Network),该网络由线性预测(自回归模型,Autoregressive Model)与非线性预测(带注意力机制的双向长短期记忆网络,Bidirectional LSTM with Attention)组成,以捕捉时间序列数据中的时序依赖关系。最后,CAE-M联合优化上述两个子网络。我们在HAR与HC数据集上对所提方法与多种前沿异常检测方法进行了实证比较。实验结果表明,本文提出的模型在检测性能上显著优于现有方法。