Klassifizierung von Brusttumoren auf der Grundlage von Histopathologie-Bildern unter Verwendung tiefer Merkmale und eines Ensembles von Gradient-Boosting-Verfahren

Brustkrebs ist weltweit die häufigste Krebserkrankung bei Frauen. Eine Frühdiagnose des Brustkrebses kann die Effizienz der Behandlung erheblich verbessern. Aufgrund ihrer Zuverlässigkeit, Genauigkeit und Kosteneffizienz werden Computer-Unterstützte Diagnosesysteme (CAD) in diesem Bereich weit verbreitet eingesetzt. Für die Diagnose von Brustkrebs existieren verschiedene bildgebende Verfahren; eines der präzisesten ist die Histopathologie, die in dieser Arbeit verwendet wird. Als zentrale Methode für den Merkmalsextraktor des vorgeschlagenen CAD-Systems wird tiefes Merkmals-Transferlernen eingesetzt. Obwohl in dieser Studie 16 verschiedene vortrainierte Netzwerke getestet wurden, liegt der Fokus vor allem auf der Klassifikationsphase. Inception-ResNet-v2, das sowohl Residual- als auch Inception-Netzwerke kombiniert, hat sich bei der Merkmalsextraktion aus histopathologischen Bildern von Brustkrebsgewebe im Vergleich zu allen untersuchten CNNs als am besten geeignet erwiesen. In der Klassifikationsphase erzielte die Ensemble-Methode aus CatBoost, XGBoost und LightGBM die höchste durchschnittliche Genauigkeit. Zur Evaluation des vorgeschlagenen Ansatzes wurde der BreakHis-Datensatz verwendet, der insgesamt 7909 histopathologische Bilder (2.480 benign und 5.429 maligne) in vier Vergrößerungsstufen (40x, 100x, 200x und 400x) enthält. Die Genauigkeit des vorgeschlagenen Verfahrens (IRv2-CXL), das 70 % des BreakHis-Datensatzes als Trainingsdaten nutzt, beträgt bei den jeweiligen Vergrößerungen 96,82 %, 95,84 %, 97,01 % und 96,15 %. Die meisten bisherigen Studien zur automatisierten Erkennung von Brustkrebs haben sich auf die Merkmalsextraktion konzentriert, was uns veranlasst hat, den Fokus auf die Klassifikationsphase zu legen. IRv2-CXL zeigt aufgrund der Anwendung der Soft-Voting-Ensemble-Methode, die die Vorteile von CatBoost, XGBoost und LightGBM synergistisch vereint, in allen Vergrößerungsstufen entweder bessere oder vergleichbare Ergebnisse.