
摘要
工业设备(即实体)如服务器主机、航天器、发动机等,通常通过多变量时间序列进行监控,其异常检测对于保障设备服务质量至关重要。然而,由于多变量时间序列具有复杂的时序依赖性和随机性,其异常检测仍面临重大挑战。本文提出 OmniAnomaly,一种基于随机循环神经网络的多变量时间序列异常检测方法,该方法在多种不同类型设备上均表现出良好的鲁棒性。其核心思想是:通过关键技术(如随机变量连接和平面归一化流)学习多变量时间序列的稳健表征,利用这些表征重构输入数据,并基于重构概率判断异常。此外,当检测到某设备出现异常时,OmniAnomaly 还能基于其组成部分的单变量时间序列的重构概率,提供可解释的分析结果。在来自航空航天领域的两个公开数据集以及由某互联网公司采集并发布的新型服务器机群数据集上开展的评估实验表明,OmniAnomaly 在三个真实世界数据集上实现了 0.86 的总体 F1 分数,显著优于表现最佳的基线方法(提升 0.09)。同时,OmniAnomaly 的解释准确率最高可达 0.89。