Eine umfassende Studie zur Segmentierung von Kolorektalpolypen mit ResUNet++, bedingtem Random Field und Test-Time-Augmentation

Die Koloskopie gilt als Goldstandard zur Erkennung von Kolorektalkrebs und dessen Vorstufen. Bestehende Untersuchungsmethoden leiden jedoch unter einer hohen Gesamtverpassematrix, wodurch viele Abnormitäten unbeachtet bleiben. Computerunterstützte Diagnosesysteme, die auf fortschrittlichen maschinellen Lernalgorithmen basieren, werden als eine transformative Technologie betrachtet, die Regionen im Dickdarm identifizieren können, die bei endoskopischen Untersuchungen von Ärzten übersehen werden, und somit zur Erkennung und Charakterisierung von Läsionen beitragen. In früheren Arbeiten haben wir die ResUNet++-Architektur vorgeschlagen und nachgewiesen, dass sie im Vergleich zu ihren Vorgängern U-Net und ResUNet effizientere Ergebnisse erzielt. In dieser Arbeit zeigen wir, dass sich die Gesamtleistung der ResUNet++-Architektur weiter verbessern lässt, indem man bedingte zufällige Felder (Conditional Random Fields, CRF) und Testzeit-Augmentation (Test-Time Augmentation, TTA) einsetzt. Wir haben umfassende Evaluierungen durchgeführt und die Verbesserungen an sechs öffentlich verfügbaren Datensätzen validiert: Kvasir-SEG, CVC-ClinicDB, CVC-ColonDB, ETIS-Larib Polyp DB, ASU-Mayo Clinic Colonoscopy Video Database und CVC-VideoClinicDB. Zudem vergleichen wir unsere vorgeschlagene Architektur und das resultierende Modell mit anderen state-of-the-art-Methoden. Um die Generalisierungsfähigkeit von ResUNet++ auf verschiedenen öffentlich verfügbaren Polyp-Datensätzen zu untersuchen, damit sie in realen klinischen Anwendungen eingesetzt werden kann, haben wir eine umfassende Kreuz-Datensatz-Evaluation durchgeführt. Die experimentellen Ergebnisse zeigen, dass die Anwendung von CRF und TTA sowohl innerhalb desselben Datensatzes als auch bei Kreuz-Datensatz-Evaluierungen die Leistung auf verschiedenen Polyp-Segmentierungs-Datensätzen signifikant verbessert.