
摘要
近年来,深度学习技术在异常检测领域展现出巨大潜力,相较于传统的统计建模与基于信号处理的方法,其在系统建模方面表现出更强的灵活性与有效性。然而,神经网络(Neural Networks, NN)仍面临若干广为人知的挑战,包括泛化能力不足、需要大量标注数据以实现有效训练,以及难以充分理解数据中的空间上下文信息。本文提出一种新型神经网络架构,将长短期记忆网络(Long Short-Term Memory, LSTM)与胶囊网络(Capsule Networks)融合于单一网络中,并构建在分支输入自编码器(branched input Autoencoder)框架下,专门用于处理多变量时间序列数据。所提出的方法采用无监督学习策略,有效缓解了获取大规模标注训练数据的难题。实验结果表明,在未进行超参数优化的情况下,引入胶囊网络显著降低了过拟合现象,并提升了训练效率。此外,结果还显示,与非分支输入模型相比,分支输入结构无论是否包含胶囊网络,均能更稳定、一致地学习多变量数据特征。该模型架构在开源基准数据集上的测试中,实现了当前最优的异常检测性能,在各项评估指标上均优于现有最先进方法,表现出卓越的整体表现。