Command Palette
Search for a command to run...
图像识别-性别检测
摘要
一句话总结
作者提出了一种无监督病灶检测框架,将任务重构为图像恢复问题,采用带有基于网络的规范性先验的概率模型,通过最大后验估计以像素级方式检测病灶。
核心贡献
- 将无监督病灶检测重构为图像恢复问题,仅利用健康影像样本估计规范性解剖分布,无需病灶标注。
- 引入一种利用网络参数化先验的概率框架来建模健康解剖结构,并在重建过程中通过最大后验估计进行像素级病灶识别。
- 实现并评估了基于变分自编码器与高斯混合变分自编码器架构的恢复流程,在健康磁共振成像扫描上进行训练以分离解剖异常值。
引言
医学影像中的无监督病灶检测能够在无需标注训练数据的情况下实现解剖异常的自动识别,作为关键的预筛查工具并提升下游诊断算法的鲁棒性。当前的深度学习方法利用潜变量模型近似健康解剖结构,并通过先验投影重建步骤检测病灶。该方法常产生较高的假阳性率,因其假设尽管存在病灶驱动的强度变化,健康组织编码仍保持稳定。作者将无监督检测重构为图像恢复问题,并利用概率最大后验估计框架进行求解。通过将基于网络的规范性先验与对大幅恢复偏差的严格惩罚相结合,该方法显著抑制了假阳性,并在胶质瘤与卒中 MRI 数据集上达到了最先进的性能。
数据集
作者利用三个公开 MRI 数据集来训练规范性先验模型并评估病灶检测性能:
- CamCAN(训练与验证): 源自剑桥衰老与神经科学中心,该队列包含 652 名 18 至 87 岁健康成人的 T1 和 T2 加权扫描。作者将数据划分为 600 名受试者用于训练 VAE 和 GMVAE 先验模型,52 名受试者用于验证超参数。
- BRATS17(评估): 下载自 2017 年多模态脑肿瘤图像分割挑战赛,该子集包含 285 名脑肿瘤患者的 T2 加权扫描,涵盖 210 例高级别胶质母细胞瘤和 75 例低级别胶质瘤。仅使用 T2 图像,因为病灶表现为高信号区域,且提供了肿瘤分割的真实标签。
- ATLAS(评估): 源自卒中后病灶解剖描记项目,该子集包含 220 例卒中患者的 T1 加权扫描。病灶表现为低信号区域,并提供像素级真实标签掩膜。
- 训练策略与数据对齐: 在 CamCAN 模态上训练两个独立的先验模型,以匹配目标评估数据集。T2 模型在 CamCAN T2 数据上训练并在 BRATS17 上评估,T1 模型在 CamCAN T1 数据上训练并在 ATLAS 上评估。
- 预处理与归一化: 所有扫描均经过去颅骨处理与 MNI 空间配准。作者对 CamCAN 受试者应用直方图匹配,随后使用固定参考受试者进行像素强度归一化。背景像素值设为 -3.5。为减少域差异,在数据集内归一化后,将 BRATS17 和 ATLAS 扫描分别直方图匹配至对应的 CamCAN 参考扫描。
- 裁剪与 2D 转换: 计算完全依赖 2D 横断面切片。移除缺乏脑组织的边缘切片及过多背景区域。所有剩余切片统一标准化为 200×200 分辨率。推理过程在每张切片上独立运行,最终评估指标在受试者级别进行汇总。
方法
作者利用基于潜变量模型架构的概率框架进行无监督病灶检测,该框架基于最大后验估计。整体方法分为两个阶段:首先,使用变分自编码器或高斯混合变分自编码器学习健康解剖图像的规范性先验分布;其次,应用基于最大后验估计的恢复方法检测新图像中的病灶。在第一阶段,模型仅在健康受试者上进行训练,以学习正常大脑解剖结构的分布。架构包含编码器与解码器,编码器将输入图像映射至潜空间,解码器从潜表示中重建图像。在 VAE 变体中,编码器输出潜变量上高斯分布的参数,而 GMVAE 通过将潜空间建模为高斯混合分布对此进行了扩展。训练过程通过最小化证据下界来近似学习模型下数据的对数似然。 
对于病灶检测,该方法将带有病灶的图像视为健康图像的受损版本,其中病灶对应于加性异常值分量。目标是通过求解平衡数据一致性与规范性先验的最大后验估计问题,恢复底层健康图像。后验分布 P(X∣Y) 被最大化,其中 X 为无病灶图像,Y 为带有病灶的观测图像。该优化过程使用证据下界进行近似,为基于梯度的优化提供了可处理的损失函数。数据一致性项 P(Y∣X) 采用全变差 (TV) 范数建模,以惩罚 X 与 Y 之间的偏差,倾向于平滑连续的类病灶结构,而非孤立的像素变化。恢复过程从输入图像 Y 开始,对联合目标进行迭代梯度上升,以获得恢复图像 X^ 和估计病灶 D^=Y−X^。 
编码器与解码器网络的架构基于残差块设计。每个块包含一个下采样卷积层,随后是批归一化和卷积层,并带有将输入加至输出的跳跃连接。该结构同时用于 VAE 与 GMVAE 模型,GMVAE 进一步在潜空间中引入了高斯分量混合。为确保公平比较,两个模型的潜变量维度均设置为 2×2×512。下采样步长为 2,上采样通过双线性插值实现。解码器网络镜像编码器结构。所有隐藏层使用 Leaky ReLU 激活函数,输出层及连接潜变量的层则使用恒等激活函数。 
实验
评估设置涉及在多个脑部 MRI 数据集上测试所提出的无监督病灶检测框架,并系统考察超参数敏感性、三维一致性及迭代恢复动态。这些实验共同验证了模型在优化过程中可靠收敛,在体素切片间保持空间连贯性,并在不同数据一致性权重与混合配置下表现出鲁棒性能。定性而言,检测准确性受病灶特征影响显著,该方法对较大异常表现可靠,但对较小或细微病变的敏感性有所降低。总体而言,研究结果证实了该框架的有效性与参数稳定性,同时也承认其在处理微弱病灶和广泛结构变形方面的固有局限。
作者对比了用于病灶检测的不同模型,重点考察了不同超参数下基于 GMVAE 方法的性能。结果表明,所提出的 GMVAE 模型相较于其他方法实现了更高的检测准确率,AUC 和 Dice 分数均有提升。分析指出,模型性能对某些超参数的变化具有鲁棒性,尤其是高斯混合数量与潜空间维度。基于 GMVAE 的方法在检测准确率方面优于其他模型,以 AUC 和 Dice 分数衡量。GMVAE 模型在不同超参数设置下的性能相对稳定,表明其具备鲁棒性。与监督基线相比,所提方法实现了更高的检测准确率,尤其在 AUC 和 Dice 分数方面表现突出。
作者将所提方法 GMVAE(TV) 与其他模型在病灶检测任务上进行对比,表明该方法相较于基线方法取得了更高的 AUC 和 Dice 分数。GMVAE(TV) 的性能在不同高斯混合数量与潜维度下相对稳定,结果仅有微小波动。该模型在 3D 切片间展现出一致的检测能力,并在迭代恢复过程中稳定收敛。在测试数据集上,所提 GMVAE(TV) 方法在 AUC 和 Dice 分数方面优于其他模型。GMVAE(TV) 的性能对高斯混合数量与潜维度变化的鲁棒性较强,表现出极小的波动。模型在迭代图像恢复期间展现稳定收敛,并在 3D 切片间保持检测一致性。
作者分析了使用 GMVAE 先验时模型超参数对检测性能的影响,重点考察高斯混合数量与潜空间维度。结果表明,尽管 AUC 值在不同配置下相对稳定,但 DSC 分数波动更为显著,某些组合实现了更高性能。模型在迭代图像恢复期间展现稳定收敛。AUC 值在不同超参数设置下相对一致,表明对参数选择具有鲁棒性。DSC 分数随超参数变化波动较大,部分配置取得了显著更高的性能。模型在迭代图像恢复过程中稳定收敛,AUC 值在经过一定数量的优化步骤后趋于稳定。
实验将所提出的基于 GMVAE 的框架与监督基线在医学病灶检测任务上进行对比,主要验证了其优越的检测准确率与整体有效性。后续分析探讨了模型对架构选择的敏感性,证实性能在不同高斯混合与潜空间维度配置下保持鲁棒。最后,研究评估了算法的计算行为,表明其在迭代图像恢复期间稳定收敛,并在三维切片间实现一致的病灶识别。