Ein unscharfer rankbasierter Ensemble-Ansatz von CNN-Modellen zur Klassifikation zervikaler Zytologie

Zervikalkrebs betrifft jährlich mehr als 0,5 Millionen Frauen und verursacht mehr als 0,3 Millionen Todesfälle. Die Früherkennung der Erkrankung ist entscheidend für die vollständige Beseitigung des Tumors aus dem Körper. Die regelmäßige, bevölkerungsweite Krebsvorsorge ist jedoch aufgrund der hohen Kosten und des aufwändigen Arbeitsaufwands bei der Detektion eingeschränkt, da Kliniker einzelne Zellen aus einem gefärbten Präparat, das mehr als 100.000 zervikale Zellen enthält, hinsichtlich ihrer Malignität klassifizieren müssen. Daher werden Computerunterstützte Diagnosesysteme (Computer-Aided Diagnosis, CAD) als praktikable Alternative für eine einfache und schnelle Krebsdetektion eingesetzt. In diesem Artikel entwickeln wir eine solche Methode, bei der wir ein Ensemble-basiertes Klassifikationsmodell unter Verwendung dreier vortrainierter Architekturen für konvolutionale neuronale Netze (Convolutional Neural Networks, CNN) – nämlich Inception v3, Xception und DenseNet-169, die auf dem ImageNet-Datensatz vortrainiert wurden – für die Klassifikation einzelner Zellen und ganzer Bildpräparate nach Pap-Färbung erstellen. Der vorgeschlagene Ensemble-Ansatz nutzt eine Fuzzy-Rang-basierte Fusion der Klassifikatoren, wobei zwei nichtlineare Funktionen auf die Entscheidungsscores der Basis-Lerner angewendet werden. Im Gegensatz zu einfachen Fusionsverfahren in der Literatur berücksichtigt die vorgeschlagene Ensemble-Technik bei der finalen Vorhersage für Testproben nicht nur die Entscheidungen der Basis-Klassifikatoren, sondern auch deren Vertrauenswürdigkeit in deren Vorhersagen. Das vorgeschlagene Modell wurde anhand zweier öffentlich verfügbaren Benchmark-Datensätze evaluiert: des SIPaKMeD-Pap-Smear-Datensatzes und des Mendeley-Liquid-Based-Cytology-(LBC)-Datensatzes, unter Verwendung eines 5-fachen Kreuzvalidierungsansatzes. Auf dem SIPaKMeD-Pap-Smear-Datensatz erreicht das vorgeschlagene Framework eine Klassifikationsgenauigkeit von 98,55 % und eine Sensitivität von 98,52 % im 2-Klassen-Setting sowie 95,43 % Genauigkeit und 98,52 % Sensitivität im 5-Klassen-Setting. Auf dem Mendeley-LBC-Datensatz erzielt das Modell eine Genauigkeit von 99,23 % und eine Sensitivität von 99,23 %. Die erzielten Ergebnisse übertreffen viele der derzeitigen State-of-the-Art-Modelle und bestätigen somit die Wirksamkeit des Ansatzes. Der zugehörige Quellcode des vorgeschlagenen Modells ist öffentlich auf GitHub verfügbar.