
摘要
在时间序列分类领域,形状片段(shapelets)是指对某一类别具有判别性的短时序片段。已有研究表明,通过将输入时间序列与多个判别性形状片段之间的距离作为输入特征,分类器能够在大量数据集上实现当前最优的分类性能。此外,形状片段易于可视化,具备良好的可解释性,因此在医疗健康等关键领域尤为吸引人,这些领域中纵向数据普遍存在。本研究提出了一种基于进化计算的新颖形状片段发现范式。该方法具有以下优势:(i)无需梯度信息,能够更轻松地跳出局部最优解,更高效地搜索合适候选解,并支持非可微目标函数;(ii)无需进行暴力搜索,显著降低了计算复杂度,可达数个数量级的缩减;(iii)形状片段的数量及其长度与形状片段本身一同演化,无需预先设定,从而避免了人工参数设定的负担;(iv)并非逐个评估单个形状片段,而是整体评估形状片段集合,从而获得规模更小、彼此间相似性更低但预测性能相近的最终形状片段集合;(v)所发现的形状片段不必是输入时间序列的子序列。本文通过实验验证了上述各项优势的有效性。