
摘要
近年来,由于智能手表和智能手机等可穿戴传感器的普及,以及深度学习方法的不断进步,人体活动识别(Human Activity Recognition, HAR)领域取得了大量研究成果。深度学习方法的优势在于无需人工从原始传感器信号中提取特征,从而显著降低了特征工程的复杂性。然而,将深度学习应用于HAR的一个显著缺点是其对人工标注训练数据的依赖,而这类标注数据在HAR数据集中尤其难以获取。目前,无监督学习方向的研究正逐步取得进展,其中深度HAR聚类模型成为重要研究方向。这类模型能够在未提供任何标签的情况下,自动为数据分配标签。然而,当前对深度HAR聚类模型的评估方法仍存在诸多问题,导致该领域的进展难以客观衡量,也制约了新方法的设计与改进。本文系统性地指出了当前深度HAR聚类模型评估中存在的若干关键问题,详细分析了这些问题的成因,并通过严谨的实验验证了它们对评估结果可能产生的显著影响。在此基础上,本文提出了相应的解决方案,并建议建立标准化的评估框架,以促进未来深度HAR聚类模型的公平比较与持续发展。此外,本文提出了一种新型的深度聚类模型用于HAR任务。在所建议的标准化评估设置下,该模型在性能上优于或至少与现有方法相当,同时具备更高的计算效率,并通过摒弃自编码器(autoencoder)结构,展现出更强的可扩展性,能够更有效地应对复杂度更高的数据集。