자궁경부 세포학 분류를 위한 CNN 모델의 퍼지 랭크 기반 앙상블

자궁경부암은 매년 50만 명 이상의 여성에게 영향을 미치며, 그로 인한 사망자 수는 30만 명을 초과한다. 환자 몸속에서 이 질병을 근절하기 위해서는 조기 단계에서 암을 조기에 발견하는 것이 매우 중요하다. 그러나 일반 인구를 대상으로 한 정기적인 암 스크리닝은 검사 과정이 고가이자 인력 집약적이어서 제한을 받고 있다. 특히, 병리학자가 암 여부를 판단하기 위해 10만 개 이상의 자궁경부 세포로 구성된 염색된 슬라이드에서 개별 세포를 분류해야 하는 점이 문제이다. 따라서 자동 진단 보조 시스템(CAD, Computer-Aided Diagnosis)이 암 조기 탐지의 효율적이고 빠른 대안으로 활용되고 있다. 본 논문에서는 ImageNet 데이터셋으로 사전 훈련된 세 가지 컨볼루션 신경망(CNN) 아키텍처인 Inception v3, Xception, DenseNet-169을 기반으로 한 앙상블 기반 분류 모델을 제안한다. 이 모델은 페파 스마어(Pap) 염색된 단일 세포 이미지 및 전체 슬라이드 이미지 분류에 활용된다. 제안된 앙상블 기법은 기저 분류기들이 생성한 결정 점수에 대해 두 가지 비선형 함수를 적용하여 퍼지 순위 기반 융합(fuzzy rank-based fusion)을 수행한다. 기존 문헌에서 흔히 사용되는 단순 융합 방식과 달리, 본 연구에서 제안하는 앙상블 기법은 기저 분류기들의 예측에 대한 신뢰도를 고려하여 테스트 샘플에 대한 최종 예측을 수행한다. 제안된 모델은 공개된 두 가지 기준 데이터셋, 즉 SIPaKMeD 페파 스마어 데이터셋과 Mendeley 액상 세포학(LBC) 데이터셋을 대상으로 5겹 교차 검증(5-fold cross-validation)을 통해 평가되었다. SIPaKMeD 페파 스마어 데이터셋에서 이 모델은 2클래스 설정에서 분류 정확도 98.55%, 민감도 98.52%를 달성하였으며, 5클래스 설정에서는 정확도 95.43%, 민감도 98.52%를 기록하였다. Mendeley LBC 데이터셋에서는 정확도와 민감도 모두 99.23%를 달성하였다. 이러한 결과는 기존의 최신 모델들을 상회하며, 제안된 방법의 효과성을 입증한다. 본 논문에서 제안하는 모델의 관련 코드는 GitHub에서 공개되어 있으며 누구나 접근 가능하다.