17 天前
AER:用于时间序列异常检测的自编码器回归模型
Lawrence Wong, Dongyu Liu, Laure Berti-Equille, Sarah Alnegheimish, Kalyan Veeramachaneni

摘要
时间序列数据的异常检测在多个工业领域中日益普遍,这些领域通过监控各类指标以预防潜在事故和经济损失。然而,标注数据的稀缺性以及异常定义的模糊性给异常检测带来了显著挑战。近年来,无监督机器学习方法在该问题上取得了显著进展,主要通过单时刻预测或时间序列重构两种途径实现。尽管传统上这两种方法被分别研究,但它们并非互斥,反而可为异常检测提供互补的视角。本文首先通过可视化的时间序列信号与异常得分,系统分析了基于预测与基于重构方法的优劣与局限性。随后,我们提出AER(Auto-encoder with Regression)模型,该模型将标准自编码器与LSTM回归器相结合,融合两类方法的优势,同时克服其各自缺陷。AER模型能够在优化联合目标函数的同时,实现双向预测,并同步重构原始时间序列。此外,我们通过一系列消融实验,探索了多种融合预测误差与重构误差的策略。最后,我们在NASA、Yahoo、Numenta和UCR提供的12个知名单变量时间序列数据集上,将AER架构的性能与两种基于预测的方法及三种基于重构的方法进行了对比。实验结果表明,AER在所有数据集上的平均F1分数最高,相比ARIMA模型提升了23.5%;同时,其运行时间与基础自编码器和回归器组件相当。本模型已集成至Orion——一个开源的时间序列异常检测基准测试工具中,可供研究者使用与评估。