
摘要
帕金森病(Parkinson’s Disease, PD)的客观步态评估受限于缺乏大规模、多样化且具有临床标注的运动数据集。为此,我们推出了CARE-PD,这是目前公开可用的规模最大、涵盖3D网格步态数据的帕金森病数据集,也是首个跨9个队列、来自8个临床中心的多中心数据集合。所有原始数据(RGB视频或动作捕捉数据)均通过统一的预处理流程转换为匿名化的SMPL人体网格模型。CARE-PD支持两项关键基准任务:监督式临床评分预测(估计统一帕金森病评分量表,UPDRS,步态评分)以及无监督运动预训练任务(包括2D关键点到3D的重建与全身3D结构重建)。临床预测性能在四种泛化协议下进行评估:数据集内泛化、跨数据集泛化、留一数据集外泛化以及多数据集域内适应。为评估其临床相关性,我们将最先进的运动编码器与传统的步态特征基线方法进行对比,结果表明,编码器在各项任务中均显著优于手工设计的特征。在CARE-PD上进行预训练可将平均关键点定位误差(MPJPE)从60.8毫米降至7.5毫米,并使帕金森病严重程度的宏平均F1分数提升17个百分点,充分证明了经过临床标注且多样化的训练数据在推动精准评估中的关键价值。