PCA 및 GWO 기반 심층 특성 선택을 이용한 자궁경부 세포학 분류

자궁경부암은 세계적으로 여성에게서 가장 흔하고 치명적인 질환 중 하나이다. 조기 진단 시 완전히 치유 가능하지만, 복잡하고 비용이 큰 검사 절차로 인해 대규모 인구를 대상으로 한 스크리닝이 현실적으로 어려운 실정이다. 따라서 임상의의 노력을 보완하기 위해 본 논문에서는 딥러닝과 진화 최적화 기반의 특징 선택 기법을 활용한 완전 자동화된 세포도상 이미지 분류 프레임워크를 제안한다. 제안된 프레임워크는 여러 개의 컨볼루션 신경망(Convolutional Neural Network, CNN) 모델로부터 심층 특징(Deep feature)을 추출하고, 계산 비용을 줄이며 빠른 수렴을 보장하기 위해 두 단계의 특징 축소 전략을 적용한다. CNN 모델로부터 추출된 특징은 높은 차원의 특징 공간을 형성하며, 이 공간의 차원은 주성분 분석(Principal Component Analysis, PCA)을 통해 99%의 분산을 유지하면서 감소시킨다. 이후 진화 최적화 알고리즘인 회색 늑대 최적화기(Grey Wolf Optimizer, GWO)를 사용하여 이 특징 공간에서 중복 없고 최적의 특징 부분집합을 선별함으로써 분류 성능을 향상시킨다. 마지막으로, 선택된 특징 부분집합을 사용하여 SVM 분류기를 학습시켜 최종 예측을 생성한다. 제안된 프레임워크는 세 가지 공개된 벤치마크 데이터셋—Mendeley 액체기반 세포도상(4종류 분류) 데이터셋, Herlev Pap 스며(7종류 분류) 데이터셋, SIPaKMeD Pap 스며(5종류 분류) 데이터셋—에서 평가되었으며, 각각 99.47%, 98.32%, 97.87%의 분류 정확도를 달성하여 본 접근법의 신뢰성을 입증하였다. 본 논문에서 제안한 방법의 관련 코드는 다음 링크에서 확인할 수 있다: https://github.com/DVLP-CMATERJU/Two-Step-Feature-Enhancement