8 个月前

摘要

数据获取和标注的困难极大地限制了3D医学影像应用中训练数据集的样本量。因此，在缺乏足够的预训练参数的情况下，从零开始构建高性能的3D卷积神经网络仍然是一项艰巨的任务。以往在3D预训练方面的努力通常依赖于自监督方法，这些方法通过预测学习或对比学习利用未标注的数据来构建不变的3D表示。然而，由于大规模监督信息的缺失，从这些学习框架中获得语义不变且具有区分性的表示仍然是一个难题。本文重新审视了一种创新而简单的全监督3D网络预训练框架，以充分利用大规模2D自然图像数据集中的语义监督信息。通过重新设计3D网络架构，重构后的自然图像被用于解决数据稀缺问题并开发强大的3D表示。在四个基准数据集上的全面实验表明，所提出的预训练模型可以有效加速收敛，同时提高多种3D医学影像任务（如分类、分割和检测）的准确性。此外，与从零开始训练相比，该方法最多可节省60%的标注工作量。在NIH DeepLesion数据集上，该方法同样实现了最先进的检测性能，优于早期的自监督和全监督预训练方法以及从零开始训练的方法。为了促进3D医学模型的进一步发展，我们的代码和预训练模型权重已公开发布在https://github.com/urmagicsmine/CSPR。

源 PDF 查看代码