3 年前

Neerav Karani Ertunc Erdil Krishna Chaitanya Ender Konukoglu

GLIGEN (基于语言到图像的生成网络)

20 小时 RTX 5090 算力资源，仅 $1 (原价 $7)

摘要

当训练数据集能够代表测试时预期遇到的各种变化时，卷积神经网络（CNNs）在监督学习问题上表现优异。然而，在医学图像分割中，如果训练图像与测试图像在采集细节（如扫描仪型号或成像协议）上存在不匹配，这一前提便不再成立。文献中已充分记录了CNN在此类场景下性能的显著下降。为解决这一问题，我们将分割CNN设计为两个子网络的级联：一个相对浅层的图像归一化CNN，后接一个对归一化图像进行分割的深度CNN。我们使用包含来自特定扫描仪和协议设置标注图像的 Training dataset 对这两个子网络进行联合训练。在测试阶段，我们基于预测分割标签上的隐式先验知识，针对每张测试图像自适应地调整图像归一化子网络。为此，我们采用独立训练的降噪自编码器（DAE）来建模合理解剖分割标签上的此类隐式先验。我们在三个解剖部位（大脑、心脏和前列腺）的多中心磁共振成像（MRI）数据集上验证了所提方法的有效性。实验结果表明，所提出的测试时自适应方法 consistently 带来性能提升，证明了该方法的潜力与通用性。

一句话总结

作者提出了一种测试时自适应神经网络，该网络将浅层图像归一化 CNN 与深层分割 CNN 串联，并在推理阶段利用去噪自编码器动态调整前者以建模解剖学先验，从而在扫描仪和协议不匹配的情况下，持续提升脑部、心脏和前列腺的多中心 MRI 分割精度。

核心贡献

提出一种两阶段分割架构，将浅层图像归一化网络与深层分割网络解耦，以解决扫描仪和协议不匹配导致的性能下降问题。
归一化子网络在测试时为每张独立图像进行自适应调整，利用独立训练的去噪自编码器建模的隐式解剖学先验。
在脑部、心脏和前列腺的多中心磁共振成像数据集上的实验表明，所提出的测试时自适应策略持续带来性能提升。

引言

用于医学图像分割的卷积神经网络在应用于使用未见扫描仪或协议采集的数据时，性能经常会出现下降。先前研究通过提取域不变特征、应用数据增强、施加形状约束或依赖概率生成模型来应对这一域泛化挑战。然而，这些方法通常需要在训练期间使用多个源域，且无法在推理时针对新型数据分布进行调整。作者利用测试时自适应技术，为每次扫描动态微调预训练的分割网络。该策略消除了预先捕获所有可能采集变化的需求，在保持与现有域不变训练流水线完全兼容的同时，提供稳健的跨域性能。

数据集

数据集构成与来源

作者使用多个公开和私有的 MRI 数据集，在三个解剖区域上评估该方法。
脑部 MRI：来源于人类连接组计划（HCP）和自闭症脑成像数据交换（ABIDE）。
前列腺 MRI：来源于美国国家癌症研究所（NCI）数据集、PROMISE12 以及苏黎世大学医院（USZ）的私有集合。
心脏 MRI：来源于自动心脏诊断挑战赛（ACDC）和右心室分割挑战赛（RVSC）。

各子集关键细节

作者将每个解剖区域的一个数据集指定为训练用的源域（SD），其余数据集作为测试用的目标域（TD）。
脑部：HCP-T1w 作为 SD，ABIDE-Caltech-T1w 和 HCP-T2w 作为 TD。由于缺乏手动标注，作者使用 FreeSurfer 为所有 15 个皮层和皮层下标签生成伪真值。
前列腺：NCI 为 SD，PROMISE12 和 USZ 为 TD。SD 和 USZ 提供中央腺体和外周带的标注，而 PROMISE12 仅标注整个腺体。作者对整体腺体及其子区域的预测进行评估。
心脏：ACDC 为 SD，RVSC 为 TD。由于两者仅标注了右心室心内膜，作者仅针对该结构评估域泛化能力，并将所有其他预测视为背景。
具体的训练、验证和测试划分数量记录于论文表 1。

论文的数据使用方式

作者仅在 SD 上训练分割网络，不混合数据集，随后在 TD 上进行测试以测量域泛化能力。
他们训练一个用于推理的 2D 分割 CNN 和一个用于域自适应的 3D 去噪自编码器（DAE），并根据 DAE 在 SD 损坏验证子集上的去噪性能选择最佳 DAE 模型。
对于涉及协议变化的脑部域偏移，他们采用基于图谱的初始化策略，利用来自 SD 的平均独热标签来指导早期优化。

裁剪策略、元数据构建与处理细节

作者使用 N4 算法去除偏置场，并基于第 1 和第 99 百分位数应用逐图像强度归一化，将数值截断至 0 到 1 的范围。
脑部图像经过去颅骨处理，将非脑体素置零。
所有图像均重缩放至固定的面内像素尺寸（脑部 0.7 mm²，前列腺 0.625 mm²，心脏 1.33 mm²），并裁剪或零填充至统一的 256x256 分辨率以供 2D 网络使用。
对于 3D DAE，作者将体素尺寸重缩放为 2.8x0.7x0.7 mm³（脑部）、2.5x0.625x0.625 mm³（前列腺）和 5.0x1.33x1.33 mm³（心脏），然后填充或裁剪至固定的 64x256x256 或 32x256x256 体积。
为避免偏差，评估前会将预测结果重新缩放回原始空间分辨率。
训练增强包括随机平移、旋转、缩放和弹性形变，心脏数据额外接受 90 度旋转和轴翻转。强度增强包括伽马校正、亮度偏移和加性高斯噪声。
DAE 的训练包含标签的几何增强，并使用基于块的损坏过程，限制最多复制 200 个尺寸最大为 20 的块。

方法

所提出的方法将分割 CNN 设计为两个子网络的串联：浅层图像归一化模块 $N_{\phi}$ 后接深层分割网络 $S_{\theta}$ 。该框架（称为 segCNN）将输入图像空间到分割空间的变换建模为 $Z = S_{\theta}(N_{\phi}(X))$ 。整体架构在源域（SD）数据集 $\mathcal{D}_{SD}$ 上进行训练，通过最小化监督损失函数（如公式 1 所定义）来估计最优参数 $\{\theta^{*}, \phi^{*}\}$ 。训练过程采用标准的监督学习目标，将网络预测与真实标签进行比较。

参考框架图以获取方法的可视化表示。该图展示了工作流程：输入图像 $X$ 首先由自适应归一化模块 $N_{\phi}$ 处理，生成归一化图像 $X_n$ 。随后，该归一化图像被输入到固定的深层分割网络 $S_{\theta^{*}}$ 中，生成预测分割 $Z_c$ 。该预测分割随后通过去噪自编码器（DAE） $D_{\psi^{*}}$ ，后者作为先验用于评估预测的合理性。DAE 输出去噪后更合理的分割 $Z$ 。通过最小化预测分割 $Z_c$ 与其去噪版本 $Z$ 之间的差异，为每张测试图像自适应调整归一化模块 $N_{\phi}$ 的参数。

核心设计选择是仅自适应图像归一化模块 $N_{\phi}$ 的参数，同时保持深层分割网络 $S_{\theta}$ 固定在其预训练值上。这一设计基于以下假设：域偏移（如扫描仪或协议的变化）主要影响低级图像统计信息和对比度，这可以通过相对浅层的归一化网络进行校正。归一化模块 $N_{\phi}$ 被建模为具有少量层和卷积核的残差 CNN，确保其仅执行强度变换而不改变底层解剖结构。该设计使方法能够充分利用预训练分割网络的全部容量，同时实现逐图像自适应。

为在无标签信息的情况下驱动此自适应过程，该方法采用预训练的去噪自编码器（DAE） $D_{\psi^{*}}$ 作为合理解剖分割的隐式先验。DAE 在源域数据集上训练，用于将损坏的分割映射为干净的分割。在测试时自适应阶段，segCNN 预测的分割被视为 DAE 的“噪声”输入。归一化模块 $N_{\phi}$ 的参数被迭代更新，以最小化预测分割与 DAE 输出之间的损失，从而有效将预测拉向更合理的解剖配置。该过程在公式 2 中形式化，其中自适应旨在最小化 DAE 输入与输出之间的差异。

对于涉及成像模态或协议差异等大幅域偏移的情况，该方法引入了基于图谱的初始化。采用基于阈值的切换机制来决定使用 DAE 输出还是仿射配准的图谱作为自适应目标。这确保自适应从合理起点开始，随后利用更灵活的 DAE 进行微调。该方法还设计为兼容 2D 分割网络，通过切片处理 3D 图像，并整合 3D DAE 的输出以指导自适应过程。

实验

评估通过比较预测输出与真实参考，衡量多个解剖区域和域偏移下的分割精度。实验将所提出的测试时自适应框架与标准基线、成熟的域泛化技术及无监督域自适应方法进行比较，消融研究验证了冻结核心网络参数并将优化限制在归一化层上的必要性。定性分析证实，该受限自适应有效缩小了跨域性能差距，且无需目标标签或大量计算资源。最终，该方法被证明比迭代去噪后处理更具鲁棒性，并与依赖标签的自适应策略高度竞争，表明一致的归一化调整为域偏移的医学成像提供了一条可靠且无需标签的路径。

作者开展实验以评估医学图像分割在不同解剖区域和数据集中的域泛化方法。他们比较了多种方法，包括基线模型、数据增强、去噪自编码器后处理以及测试时自适应，重点关注模型在无标注目标数据下对未见域的泛化能力。所提出的测试时自适应方法实现了与无监督域自适应方法相当的性能，且无需标注的源域数据。数据增强显著提升了泛化能力，但去噪自编码器后处理的结果因解剖域而异，表现不一。测试时自适应优于使用多次去噪自编码器传递的简单后处理，尤其在复杂解剖结构上表现更佳。

作者在不同解剖区域上评估了一种用于医学图像分割的测试时自适应方法，并将其与多种域泛化和无监督域自适应方法进行比较。结果表明，该方法与现有方法具有竞争力的性能，特别是在缺乏标注源域数据的场景中，并在自适应过程中展现出有效的收敛性。所提出的测试时自适应方法与无监督域自适应方法取得相当的结果，尤其适用于扫描仪变更相关的域偏移。该方法优于基线方法，并在不同解剖区域和测试域中表现出一致的收敛性。测试时自适应提供了优于去噪自编码器后处理的性能，尤其在脑部等复杂解剖结构上。

作者在不同解剖区域上评估了多种医学图像分割的域泛化方法，将所提出的测试时自适应方法与基线、基准及最先进方法进行比较。结果表明，该方法实现了具有竞争力的性能，尤其在域偏移显著的场景中，并证明了受限自适应与 DAE 集成的重要性。分析突显了测试时自适应在无需标注目标域数据的情况下提升分割精度的有效性。与最先进域泛化和无监督域自适应方法相比，所提出的测试时自适应方法取得了竞争性结果，尤其适用于大幅域偏移。仅对输入归一化模块进行受限自适应提升了分割精度和稳定性，相较于自适应所有参数或仅使用后处理更具优势。该方法在不同解剖区域和域偏移中表现良好，与基线及相关方法相比，Dice 分数和 Hausdorff 距离指标均有提升。

实验比较了基线模型、数据增强、后处理技术以及所提出的测试时自适应策略，以验证其在无标签数据下泛化至未见医学图像域的有效性。虽然数据增强持续提升跨域性能，但去噪自编码器后处理的结果因解剖结构而异，表现不一致。所提出的测试时自适应方法展现出显著的定性优势，在无需标注源数据的情况下达到与无监督域自适应方法相当的性能，同时持续优于基线模型和简单后处理技术。此外，将自适应限制在输入归一化模块而非更新所有网络参数，显著增强了分割稳定性，并在多样化的域偏移中实现了可靠的收敛。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

运行此教程在 Discord 上讨论

3 年前

Neerav Karani Ertunc Erdil Krishna Chaitanya Ender Konukoglu

GLIGEN (基于语言到图像的生成网络)

20 小时 RTX 5090 算力资源，仅 $1 (原价 $7)

跳转至 Notebook

摘要

一句话总结

核心贡献

提出一种两阶段分割架构，将浅层图像归一化网络与深层分割网络解耦，以解决扫描仪和协议不匹配导致的性能下降问题。
归一化子网络在测试时为每张独立图像进行自适应调整，利用独立训练的去噪自编码器建模的隐式解剖学先验。
在脑部、心脏和前列腺的多中心磁共振成像数据集上的实验表明，所提出的测试时自适应策略持续带来性能提升。

引言

数据集

数据集构成与来源

作者使用多个公开和私有的 MRI 数据集，在三个解剖区域上评估该方法。
脑部 MRI：来源于人类连接组计划（HCP）和自闭症脑成像数据交换（ABIDE）。
前列腺 MRI：来源于美国国家癌症研究所（NCI）数据集、PROMISE12 以及苏黎世大学医院（USZ）的私有集合。
心脏 MRI：来源于自动心脏诊断挑战赛（ACDC）和右心室分割挑战赛（RVSC）。

各子集关键细节

作者将每个解剖区域的一个数据集指定为训练用的源域（SD），其余数据集作为测试用的目标域（TD）。
脑部：HCP-T1w 作为 SD，ABIDE-Caltech-T1w 和 HCP-T2w 作为 TD。由于缺乏手动标注，作者使用 FreeSurfer 为所有 15 个皮层和皮层下标签生成伪真值。
前列腺：NCI 为 SD，PROMISE12 和 USZ 为 TD。SD 和 USZ 提供中央腺体和外周带的标注，而 PROMISE12 仅标注整个腺体。作者对整体腺体及其子区域的预测进行评估。
心脏：ACDC 为 SD，RVSC 为 TD。由于两者仅标注了右心室心内膜，作者仅针对该结构评估域泛化能力，并将所有其他预测视为背景。
具体的训练、验证和测试划分数量记录于论文表 1。

论文的数据使用方式

作者仅在 SD 上训练分割网络，不混合数据集，随后在 TD 上进行测试以测量域泛化能力。
他们训练一个用于推理的 2D 分割 CNN 和一个用于域自适应的 3D 去噪自编码器（DAE），并根据 DAE 在 SD 损坏验证子集上的去噪性能选择最佳 DAE 模型。
对于涉及协议变化的脑部域偏移，他们采用基于图谱的初始化策略，利用来自 SD 的平均独热标签来指导早期优化。

裁剪策略、元数据构建与处理细节

作者使用 N4 算法去除偏置场，并基于第 1 和第 99 百分位数应用逐图像强度归一化，将数值截断至 0 到 1 的范围。
脑部图像经过去颅骨处理，将非脑体素置零。
所有图像均重缩放至固定的面内像素尺寸（脑部 0.7 mm²，前列腺 0.625 mm²，心脏 1.33 mm²），并裁剪或零填充至统一的 256x256 分辨率以供 2D 网络使用。
对于 3D DAE，作者将体素尺寸重缩放为 2.8x0.7x0.7 mm³（脑部）、2.5x0.625x0.625 mm³（前列腺）和 5.0x1.33x1.33 mm³（心脏），然后填充或裁剪至固定的 64x256x256 或 32x256x256 体积。
为避免偏差，评估前会将预测结果重新缩放回原始空间分辨率。
训练增强包括随机平移、旋转、缩放和弹性形变，心脏数据额外接受 90 度旋转和轴翻转。强度增强包括伽马校正、亮度偏移和加性高斯噪声。
DAE 的训练包含标签的几何增强，并使用基于块的损坏过程，限制最多复制 200 个尺寸最大为 20 的块。

方法

实验

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

面向鲁棒医学图像分割的测试时自适应神经网络

Neerav Karani Ertunc Erdil Krishna Chaitanya Ender Konukoglu

GLIGEN (基于语言到图像的生成网络)

摘要

一句话总结

核心贡献

引言

数据集

方法

实验

用 AI 构建 AI

HyperAI Newsletters

Command Palette

面向鲁棒医学图像分割的测试时自适应神经网络

Neerav Karani Ertunc Erdil Krishna Chaitanya Ender Konukoglu

GLIGEN (基于语言到图像的生成网络)

摘要

一句话总结

核心贡献

引言

数据集

方法

实验

用 AI 构建 AI

HyperAI Newsletters

Command Palette

面向鲁棒医学图像分割的测试时自适应神经网络

Neerav Karani Ertunc Erdil Krishna Chaitanya Ender Konukoglu

GLIGEN (基于语言到图像的生成网络)

摘要

一句话总结

核心贡献

引言

数据集

方法

实验

用 AI 构建 AI

HyperAI Newsletters