Verbesserung der computergestützten Schätzung der Schweregrad von Colitis ulcerosa gemäß dem Mayo-Endoskopie-Score durch den Einsatz von regressionsbasiertem Deep Learning
Hintergrund: Die Beurteilung der endoskopischen Aktivität bei kolitis ulcerosa (UC) ist entscheidend für Therapieentscheidungen und die Überwachung des Krankheitsverlaufs. Allerdings beeinträchtigt die erhebliche inter- und intraobserver-Abweichlichkeit bei der Bewertung die Zuverlässigkeit der Beurteilung. Ziel unserer Studie war die Entwicklung eines computerunterstützten Diagnosesystems auf Basis von Deep Learning, um die Subjektivität zu reduzieren und die Zuverlässigkeit der Beurteilung zu verbessern.Methoden: Die Studienkoorte umfasste 11.276 Bilder von 564 Patienten, die aufgrund einer UC eine Koloskopie durchliefen. Wir stellen einen regressive Deep-Learning-Ansatz zur endoskopischen Bewertung der UC nach dem Mayo-Endoskopie-Score (MES) vor. Zur Leistungsbewertung und -vergleich wurden fünf aktuelle Architekturen convolutionaler neuronalen Netze (CNN) eingesetzt. Zur Modelltrainierung und objektiven Benchmarking wurde eine zehnfache Kreuzvalidierung verwendet. Die Modellleistung wurde anhand des quadratisch gewichteten Kappa-Statistik und der Makro-F1-Score für die vollständige MES-Klassifizierung sowie der Kappa-Statistik und des F1-Scores für die Remissionsklassifizierung bewertet.Ergebnisse: Die fünf in der Studie verwendeten klassifizierungsorientierten CNNs zeigten hervorragende Übereinstimmung mit den Expertenannotationen für alle MES-Unterscores und die Remissionsklassifizierung gemäß der Kappa-Statistik. Bei Anwendung des vorgeschlagenen regressiven Ansatzes ergab sich (1) eine statistisch signifikante Leistungssteigerung bei den meisten Modellen und (2) eine höhere Robustheit der Ergebnisse auf dem Testset, da Modelle, die auf unterschiedlichen Kreuzvalidierungsfolds trainiert wurden, geringere Abweichungen untereinander aufwiesen.Schlussfolgerungen: Umfassende experimentelle Evaluierungen zeigen, dass üblicherweise eingesetzte klassifizierungsorientierte CNN-Architekturen eine erfolgreiche Leistung bei der Beurteilung der endoskopischen Krankheitsaktivität bei UC erzielen. Die Integration fachspezifischen Wissens in diese Architekturen erhöht sowohl die Leistungsfähigkeit als auch die Robustheit und beschleunigt deren Überführung in die klinische Anwendung.