潜在扩散自编码器:迈向高效且有意义的医学影像无监督表征学习
Gabriele Lozupone, Alessandro Bria, Francesco Fontanella, Frederick J. A. Meijer, Claudio De Stefano, Henkjan Huisman
发布日期: 4/16/2025

摘要
本研究提出了潜在扩散自编码器(Latent Diffusion Autoencoder, LDAE),这是一种新颖的基于扩散的编码器-解码器框架,用于医学影像中的高效和有意义的无监督学习,特别关注阿尔茨海默病(Alzheimer's disease, AD),并以ADNI数据库中的脑部MRI作为案例研究。与传统的在图像空间中操作的扩散自编码器不同,LDAE在压缩的潜在表示中应用扩散过程,提高了计算效率,并使3D医学影像表示学习变得可行。 为了验证所提出的框架,我们探讨了两个关键假设:(i) LDAE能够有效捕捉与AD和衰老相关的3D脑部MRI中的有意义的语义表示;(ii) LDAE在保持计算效率的同时,能够实现高质量的图像生成和重建。实验结果支持这两个假设:(i) 线性探针评估显示了对AD诊断(ROC-AUC:90%,ACC:84%)和年龄预测(MAE:4.1年,RMSE:5.2年)的良好性能;(ii) 学习到的语义表示能够进行属性操作,产生解剖学上合理的修改;(iii) 语义插值实验表明,该模型能够强健地重建缺失的扫描图像,对于6个月的时间间隔,SSIM为0.969(MSE:0.0019);即使对于更长的时间间隔(24个月),模型仍能保持稳健性能(SSIM > 0.93,MSE < 0.004),显示出其捕捉时间进展趋势的能力;(iv) 与传统扩散自编码器相比,LDAE显著提高了推理吞吐量(快20倍),同时增强了重建质量。 这些发现表明LDAE是一个有前景的框架,适用于可扩展的医学影像应用,并有可能成为医学影像分析的基础模型。代码可在以下地址获取:https://github.com/GabrieleLozupone/LDAE