17 天前

基于模糊排序的CNN模型集成用于宫颈细胞学分类

{Ram Sarkar, Aleksandr Sinitca, Dmitrii Kaplun, Rohit Kundu, Ankur Manna}
基于模糊排序的CNN模型集成用于宫颈细胞学分类
摘要

宫颈癌每年影响超过50万名女性,导致逾30万人死亡。在疾病早期阶段实现癌症的检测,对于彻底清除患者体内的癌细胞具有至关重要的意义。然而,由于常规人群筛查受限于高昂的成本和繁重的人工操作,实际应用面临挑战:临床医生需从包含超过10万例宫颈细胞的染色切片中逐一识别并分类单个细胞,以判断其是否具有恶性特征。为此,计算机辅助诊断(Computer-Aided Diagnosis, CAD)系统作为一种高效、快速的替代方案应运而生。本文提出了一种基于集成学习的新型分类方法,采用三种在ImageNet数据集上预训练的卷积神经网络(Convolutional Neural Network, CNN)架构——Inception v3、Xception与DenseNet-169,用于巴氏涂片单细胞图像及全切片图像的分类任务。所提出的集成框架通过一种基于模糊排序的融合策略,对各基础分类器输出的决策分数引入两个非线性函数进行融合。与现有文献中常见的简单融合方法不同,该方法在做出最终预测时,充分考虑了各基础分类器预测结果的置信度,从而提升了模型的鲁棒性与判别能力。该模型在两个公开可用的基准数据集上进行了评估:SIPaKMeD巴氏涂片数据集和Mendeley液基细胞学(Liquid-Based Cytology, LBC)数据集,均采用五折交叉验证方案。在SIPaKMeD数据集中,该框架在二分类设置下取得了98.55%的分类准确率和98.52%的敏感度;在五分类设置下,准确率达到95.43%,敏感度为98.52%。在Mendeley LBC数据集中,模型实现了99.23%的准确率与99.23%的敏感度。实验结果显著优于多项当前最先进的模型,充分验证了所提方法的有效性与优越性。本文所提出的模型相关代码已公开发布于GitHub平台,供学术界与工业界参考与使用。