2 个月前

SynthEnsemble:用于多标签胸部X光分类的CNN、视觉变换器和混合模型融合方法

S.M. Nabil Ashraf; Md. Adyelullahil Mamun; Hasnat Md. Abdullah; Md. Golam Rabiul Alam
SynthEnsemble:用于多标签胸部X光分类的CNN、视觉变换器和混合模型融合方法
摘要

胸部X光片广泛用于诊断胸腔疾病,但由于这些异常情况的详细信息不足,开发准确的自动化诊断系统变得极具挑战性,而早期发现和有效治疗对此类疾病至关重要。为了解决这一难题,我们采用了深度学习技术来识别胸部X光片中与不同疾病相对应的模式。我们在“ChestX-ray14”数据集上进行了实验,使用了多种预训练的卷积神经网络(CNN)、变压器模型(transformers)、混合模型(CNN+Transformer)以及经典模型。表现最佳的单一模型是CoAtNet,其在接收者操作特征曲线下的面积(AUROC)达到了84.2%。通过使用差分进化方法确定每个模型的权重,并对所有训练模型的预测结果进行加权平均集成,我们将AUROC进一步提高到85.4%,超过了该领域的其他最先进方法。我们的研究结果表明,深度学习技术,尤其是集成深度学习技术,在提高胸部X光片自动诊断胸腔疾病的准确性方面具有巨大潜力。代码可在以下地址获取:https://github.com/syednabilashraf/SynthEnsemble

SynthEnsemble:用于多标签胸部X光分类的CNN、视觉变换器和混合模型融合方法 | 最新论文 | HyperAI超神经