18 天前

ClaSP - 时间序列分割

{Ulf Leser, Arik Ermshaus, Patrick Schäfer}
摘要

生物或物理过程的研究通常会产生一系列按时间顺序排列的数值,即时间序列(Time Series, TS)。观测过程中的变化,例如由自然事件或系统内部状态改变所引起,会导致测量值的相应变化。时间序列分割(Time Series Segmentation, TSS)旨在识别这些变化,从而推断 underlying 过程的演变。TSS通常被建模为无监督学习问题,目标是识别出在某些统计特性上具有可区分性的子段。本文提出一种新颖且高精度的时间序列分割方法——ClaSP。ClaSP采用分层分割策略,将时间序列递归地划分为两个部分。每个分割点通过训练一个二分类时间序列分类器来确定,该分类器针对所有可能的分割点进行评估,最终选择分类准确率最高的分割点,即该分割点能最有效地将子序列区分为两个不同分区。在包含98个数据集的基准测试中,我们通过实验评估验证了ClaSP的性能:其在分割准确率方面显著优于当前最先进的方法,并且在速度上也快于次优方法。此外,我们通过多个真实世界时间序列案例,展示了ClaSP在实际应用中的有效性和优越性。