17 天前

基于PCA与GWO增强的深度特征选择的宫颈细胞分类

Hritam Basak, Rohit Kundu, Sukanta Chakraborty, Nibaran Das
基于PCA与GWO增强的深度特征选择的宫颈细胞分类
摘要

宫颈癌是全球女性中最致命且最常见的疾病之一。若能在早期阶段确诊,该病完全可治愈;然而,当前检测流程繁琐且成本高昂,难以实现大规模人群筛查。为辅助临床医生的工作,本文提出一种完全自动化的框架,结合深度学习与基于进化优化的特征选择方法,用于宫颈细胞学图像分类。该框架从多个卷积神经网络(Convolutional Neural Network, CNN)模型中提取深度特征,并采用两步式特征降维策略,以降低计算成本并加速收敛。首先,利用主成分分析(Principal Component Analysis, PCA)对CNN提取的高维特征空间进行降维,同时保留99%的方差信息;随后,采用一种进化优化算法——灰狼优化器(Grey Wolf Optimizer, GWO),从降维后的特征空间中筛选出非冗余且最优的特征子集,从而进一步提升分类性能。最终,使用选定的特征子集训练支持向量机(SVM)分类器,生成最终预测结果。本文所提出的框架在三个公开的基准数据集上进行了评估:Mendeley液基细胞学(4类)数据集、Herlev宫颈涂片(7类)数据集以及SIPaKMeD宫颈涂片(5类)数据集,分别取得了99.47%、98.32%和97.87%的分类准确率,充分验证了该方法的可靠性与有效性。相关代码已开源,可访问:https://github.com/DVLP-CMATERJU/Two-Step-Feature-Enhancement