Command Palette
Search for a command to run...
一键部署时空智能回归 (STIR) 模型 gnnwr
摘要
一句话总结
本文提出了一种广义时空高斯过程(gSTGP),通过随时间变化的空间核特征值来捕捉空间依赖性的时间演化,生成具有拟克罗内克和结构的非平稳、非可分协方差矩阵。该方法避免了联合位置-时间建模的低效性,并在模拟实验及阿尔茨海默病患者的纵向神经影像学分析中展现了统计有效性与计算效率。
核心贡献
- 提出了一种新型贝叶斯非参数广义时空高斯过程(gSTGP),通过梅尔塞(Mercer)表示法动态调整空间核特征值随时间的变化,从而对空间依赖性的时间演化进行建模。
- 该框架采用拟克罗内克和协方差结构,生成高度稀疏的联合协方差矩阵以支持高效的贝叶斯推断,并附带包括后验收缩在内的理论保证。
- 全面的模拟实验以及利用阿尔茨海默病神经影像学倡议(ADNI)数据进行的纵向正电子发射断层扫描(PET)分析,证明了该方法相较于现有非平稳、非可分模型在统计有效性与计算效率方面的优势。
引言
时空数据推动了气候建模与神经科学中的关键应用,其中捕捉空间关系随时间的变化对于准确预测和疾病追踪至关重要。这一动态现象在形式上被定义为空间依赖性的时间演化,需要能够表示时变空间协方差的统计模型。传统的时空高斯过程方法在此任务上面临挑战,因为它们依赖平稳或可分离核,强制空间依赖性保持恒定。尽管新型非可分离方法提供了更高的灵活性,但它们通常将空间与时间合并为单一联合变量,从而产生计算成本高昂的密集协方差矩阵。本文作者利用广义时空高斯过程,通过梅尔塞表示法动态调整空间核的特征值来引入时间依赖性。该架构生成具有拟克罗内克和结构的非平稳、非可分协方差模型,实现了计算高效且完全灵活的贝叶斯非参数学习,用于捕捉空间依赖性的时间演化。
数据集
- 数据集来源与构成: 作者使用了阿尔茨海默病神经影像学倡议(ADNI)项目的纵向正电子发射断层扫描(PET)脑部成像数据。该数据集包含51名老年受试者,分为三个诊断组:14名认知正常(CN)受试者、27名轻度认知障碍(MCI)受试者以及19名阿尔茨海默病(AD)患者。
- 子集详情与随访结构: 扫描会话安排在基线、6个月、1年、18个月、2年和3年。每个受试者的时间点数量因队列而异,范围在四到六个之间。MCI组提供长达18个月的数据,而AD组追踪时间长达两年。
- 处理与裁剪策略: 原始扫描图像经过空间对齐的共配准处理,对六个五分钟采集帧进行平均,标准化至160 × 160 × 96的体素网格,并进行平滑处理以实现均匀分辨率。随后,作者将每个三维体积裁剪以提取第48个中心水平切片,从而为所有受试者和时间点生成一致的160 × 160像素矩阵。
- 模型应用与计算处理: 完整的纵向数据集直接应用于广义STGP模型(模型II),以追踪大脑结构与功能随时间的变化,未进行显式的训练集与测试集划分或混合比例设置。为管理庞大的25,600 × 25,600空间依赖矩阵,作者构建了基于图拉普拉斯算子的核函数,将精度矩阵稀疏化至仅含0.035%的非零元素,从而实现了对空间依赖性时间演化的高效分析。
方法
作者开发了一种广义时空高斯过程(STGP)框架,用于对时空数据中的空间依赖性时间演化(TESD)进行建模,以解决标准可分离STGP的局限性。该方法的核心在于向空间协方差结构中引入时间依赖性。标准STGP(称为模型0)假设使用可分离核,即联合时空协方差是纯空间核 Cx 与纯时间核 Ct 的克罗内克积。该结构本质上限制了空间协方差仅能随时间按标量因子变化,因此无法捕捉被定义为TESD的复杂非平稳空间关系演化。
为克服这一限制,作者提出了两种广义模型(模型I与模型II),引入了时变空间核 Cx∣t。模型I作为参考基准,采用拟克罗内克积结构,其先验协方差定义为 Cx∣t⊗˙Ct。该公式导致联合协方差矩阵呈密集状态,因为时变空间核 Cx∣t 在所有时间点上与时间核耦合。相比之下,作者提出并推荐的模型II采用拟克罗内克和结构,定义为 Cx∣t⊕˙Ct。该结构将先验与似然分量分离:先验协方差 CmII 为 Ix⊗Ct,用于建模均值过程;似然协方差 Cy∣mII 为 Cx∣t⊗˙It,用于建模噪声。这种分离使得联合协方差矩阵高度稀疏且结构化,因为时变空间核 Cx∣t 仅影响完整协方差矩阵的对角块,对应每个时间点的TESD。下图直观展示了三种模型联合核的结构差异。 
时变空间核 Cx∣t 基于梅尔塞定理构建,该定理将协方差核表示为其特征函数的级数展开。作者通过允许基础空间核 Cx 的特征值随时间变化来定义 Cx∣t。特征函数 {ϕℓ(x)} 保持固定并源自基础核,而特征值 {λℓ(t)} 被建模为时变过程。具体而言,将 λℓ(t) 定义为高斯过程 GP(0,Cλ,ℓ),从而实现对时变特征值的完整贝叶斯处理。时变核由此由级数 Cx∣t(x,x′)=∑ℓ=1∞λℓ2(t)ϕℓ(x)ϕℓ(x′) 给出。作者证明,该构造方式(特别是当特征值采用特定衰减率 γℓ=ℓ−κ/2 时)确保了核的良定性,并提供了理想的理论性质。
该框架辅以完整的后验推断方案。下图中的图形模型展示了三种模型的层次结构,揭示了超参数、潜在过程与观测数据之间的依赖关系。针对模型II,推断采用Metropolis-Within-Gibbs方案,其中包含用于超参数的切片采样器以及用于时变特征值的椭圆切片采样器。模型II的计算效率是其关键优势,因其稀疏结构相较于模型I的密集结构可显著降低计算复杂度。 
实验
所提出的广义时空高斯过程模型在模拟非平稳过程与实际PET脑部成像数据上,与一系列参数化替代方法进行了对比评估。模拟实验验证了模型在不同插值与外推场景下,准确拟合与预测均值函数及随时间演化的空间依赖性的能力;神经影像学研究则验证了其提取有意义连接模式并扩展至高维数据的潜力。定性来看,参数化模型始终未能捕捉动态空间相关性,往往退化为静态或错误的协方差结构;而所提出的拟克罗内克和模型可靠地刻画了时变依赖性,并成功将预测扩展至未见位置与未来时间点。最终,该方法在建模复杂时空协方差方面展现出更高的准确性与计算效率,同时揭示了与认知衰退相关的渐进式神经连接丢失现象。
作者对比了多种时空模型(含参数化与非参数化方法),重点评估其建模与预测时间演化空间依赖性(TESD)的能力。所提出的模型作为一种非平稳、非可分且非参数化的方法,在捕捉TESD方面相较于其他模型表现更优,尤其在模拟数据与实际脑部成像数据中均如此。该方法以更高的效率与准确性实现这一目标,特别是在预测协方差函数及将空间依赖性扩展至新位置方面。所提出的非参数模型在模拟与实际数据中捕捉时变空间依赖性的能力均优于参数化模型。该模型能准确预测协方差函数并将空间依赖性扩展至其他模型失效的新位置。相较于其他模型,所提模型在取得更优性能的同时消耗的计算时间更少。
作者利用模拟与实际脑部成像数据,对比了所提出的qKron-sum模型与多种时空模型在拟合与预测均值及协方差函数方面的表现。结果表明,该模型在两种设置下均能有效捕捉时变空间依赖性,在估计与预测协方差结构方面优于其他模型,尤其在复杂的实际应用中表现突出。在模拟与实际脑部成像数据中,qKron-sum模型能准确估计时变空间依赖性,而其他模型则无法捕捉动态协方差模式。该模型在协方差函数的预测性能上更优,特别是在向新位置或未来时间点外推时。相较于密集参数化模型,所提模型在实际数据应用中以显著更低的计算成本取得了更优结果。
作者对比了包括所提出的具有拟克罗内克和结构的广义STGP模型在内的多种时空模型,与现有参数化模型在模拟与实际脑部成像数据上的表现。结果显示,所提模型在估计与预测时间演化空间依赖性方面误差显著更低,同时具备更高的计算效率。其他模型未能准确捕捉动态空间相关性,尤其是在缺乏真实协方差作为对比基准的实际数据中。所提模型在估计时间演化空间依赖性方面全面优于其他模型,误差显著更低且计算速度更快。即便应用于实际脑部成像数据,其他模型仍无法准确捕捉时变空间相关性。所提模型能有效将空间依赖性扩展至无数据的新位置,充分展现了其灵活性与非参数化特性。
作者将所提出的广义时空高斯过程模型与多种现有模型在模拟与实际脑部成像数据上进行了对比。结果表明,该模型在两种场景下均能有效捕捉时间演化空间依赖性,在估计与预测空间协方差函数方面优于其他模型,尤其在捕捉随时间变化的动态特征及将预测扩展至新位置方面表现突出。相较于其他密集模型,所提模型也展现出更高的计算效率。该模型能准确捕捉模拟与实际数据中的时变空间依赖性,在空间协方差函数的估计与预测任务上全面领先。所提模型能有效将预测扩展至无数据的新位置,彰显了完全非参数化方法的优势。该模型计算高效,在拟合与预测任务中取得更优性能的同时,耗时显著少于其他密集模型。
作者对比了包括所提qKron-sum模型在内的多种时空模型在拟合与预测均值函数及时间演化空间依赖性(TESD)方面的表现。与其他模型相比,qKron-sum模型在估计TESD时误差显著更低,预测更准确且计算速度更快。所有模型在均值估计方面表现相当,但仅qKron-sum模型能准确捕捉模拟与实际脑部成像数据中的时变空间相关性。该模型在估计时间演化空间依赖性方面全面领先,误差显著更低。尽管各模型在均值函数估计上性能相近,但仅qKron-sum模型能准确捕捉时变空间相关性。qKron-sum模型效率更高,在取得更优预测精度的同时消耗的计算时间更少。
实验利用模拟与实际脑部成像数据集,将所提出的非参数时空模型与现有参数化及密集替代方法进行了评估,以验证其捕捉时间演化空间依赖性并预测动态协方差结构的能力。在所有设置下,所提框架均通过准确追踪时变空间相关性并成功外推至未观测位置与未来时间点,持续优于竞争方法。尽管所有模型在均值函数估计方面表现相当,但仅所提方法能有效处理复杂的实际模式,同时所需计算时间显著更少。