摘要
医疗领域生成的时间序列数据量正以极快的速度增长,随之而来的是对能够分析这些数据、检测异常并提供有意义洞察的方法的迫切需求。然而,目前大多数可用数据均未标注,因此在这一背景下,异常检测对研究人员和实践者而言仍是一项重大挑战。近年来,基于深度生成模型的无监督表示学习方法被广泛应用于数据表示的提取,无需依赖大规模标注数据集。受其成功应用的启发,本文提出一种面向时间序列数据的无监督异常检测框架。在该方法中,表示学习与异常检测均完全无需标注信息,且训练数据中可包含异常样本。首先,我们利用变分循环自编码器(Variational Recurrent Autoencoder)学习时间序列的低维表示;随后,基于所学表示,结合聚类方法与Wasserstein距离实现异常时间序列的检测。在公开可用的ECG5000心电图数据集上的实验结果表明,所提出方法能够在完全无监督的条件下有效识别异常心搏,同时生成结构清晰且表达能力强的数据表示。此外,该方法在该数据集上的表现优于以往的监督与无监督异常检测方法。