17 天前
ESPRESSO:面向异构传感器数据处理的熵与形状感知时间序列分割
Shohreh Deldari, Daniel V. Smith, Amin Sadri, Flora D. Salim

摘要
从高维可穿戴传感器数据、智能设备数据或物联网(IoT)数据中提取具有信息量且语义明确的时间片段,是人体活动识别(Human Activity Recognition, HAR)、轨迹预测、手势识别以及生活日志(lifelogging)等应用中至关重要的预处理步骤。本文提出了一种名为ESPRESSO(Entropy and ShaPe awaRe timE-Series SegmentatiOn,即基于熵与时间形状感知的时间序列分段)的混合分段模型,用于多维时间序列数据。该模型旨在充分利用时间序列的熵特征与时间形状特性,区别于现有方法仅聚焦于时间序列的特定统计或时间属性。在模型构建过程中,我们提出了一种新型的时间序列表示方法——WCAC(Weighted Cumulative Accumulation of Change),并结合一种基于贪婪搜索的策略,依据熵度量来估计最优时间片段。实验结果表明,ESPRESSO在七个公开的可穿戴与无穿戴传感数据集上,相较于四种先进方法均表现出更优的性能。此外,我们对这些数据集进行了深入分析,探究了ESPRESSO及其组成部分在不同数据特征下的表现差异。最后,本文提供了两个具有启发性的案例研究,展示了如何利用ESPRESSO有效推断人类的日常活动规律及情绪状态。