Verwendung von DUCK-Net für die Polypen-Bildsegmentierung

Diese Arbeit stellt eine neuartige überwachte convolutionale neuronalen Netzwerkarchitektur, „DUCK-Net“, vor, die in der Lage ist, effektiv und generalisierend aus geringen Mengen medizinischer Bilder zu lernen, um präzise Segmentierungsaufgaben durchzuführen. Unser Modell nutzt eine Encoder-Decoder-Struktur mit einem residualen Downsampling-Mechanismus und einem maßgeschneiderten convolutionalen Block, um Bilddateninformationen auf mehreren Auflösungsebenen im Encoder-Teil zu erfassen und zu verarbeiten. Wir setzen Techniken der Datenverstärkung (data augmentation) ein, um die Trainingsmenge zu erweitern und somit die Leistungsfähigkeit unseres Modells zu steigern. Obwohl unsere Architektur vielseitig und auf verschiedene Segmentierungsaufgaben anwendbar ist, demonstrieren wir in dieser Studie ihre Fähigkeiten speziell für die Polypen-Segmentierung in Koloskopie-Bildern. Wir bewerten die Leistung unserer Methode an mehreren etablierten Benchmark-Datensätzen für die Polypen-Segmentierung – Kvasir-SEG, CVC-ClinicDB, CVC-ColonDB und ETIS-LARIBPOLYPDB – und zeigen, dass sie state-of-the-art-Ergebnisse in Bezug auf den mittleren Dice-Koeffizienten, den Jaccard-Index, die Präzision, die Recall-Rate und die Genauigkeit erzielt. Unser Ansatz zeigt starke Generalisierungsfähigkeiten und erreicht hervorragende Ergebnisse auch bei begrenzten Trainingsdaten. Der Quellcode ist öffentlich auf GitHub verfügbar: https://github.com/RazvanDu/DUCK-Net