MSRF-Net: Ein Multi-Scale Residual Fusion Netzwerk für die Segmentierung medizinischer Bilder

Methoden auf Basis von Faltungsneuronalen Netzwerken haben die Leistungsfähigkeit der Segmentierung biomedizinischer Bilder erheblich verbessert. Dennoch können die meisten dieser Ansätze Objekte variabler Größe nicht effizient segmentieren und sind auf kleinen, verzerrten Datensätzen schlecht trainierbar, was für biomedizinische Anwendungsfälle typisch ist. Obwohl Methoden existieren, die Multi-Skala-Fusionsansätze einsetzen, um die Herausforderungen bei variabler Objektgröße zu bewältigen, verwenden sie in der Regel komplexere Modelle, die eher für allgemeine semantische Segmentierungsaufgaben geeignet sind. In diesem Artikel stellen wir eine neuartige Architektur namens Multi-Scale Residual Fusion Network (MSRF-Net) vor, die speziell für die Segmentierung biomedizinischer Bilder entworfen wurde. Das vorgeschlagene MSRF-Net ist in der Lage, Multi-Skala-Features mit unterschiedlichen Empfindlichkeitsfeldern über einen Dual-Scale Dense Fusion (DSDF)-Block auszutauschen. Der DSDF-Block ermöglicht einen präzisen Informationsaustausch zwischen zwei verschiedenen Auflösungsskalen, während das MSRF-Unternetzwerk mehrere DSDF-Blöcke sequenziell nutzt, um eine effektive Multi-Skala-Fusion durchzuführen. Dadurch wird die Auflösung erhalten, die Informationsfluss verbessert und sowohl hoch- als auch niederwertige Merkmale effizient propagiert, um präzise Segmentierungskarten zu erzeugen. Das vorgeschlagene MSRF-Net kann Objektvariabilitäten erfassen und liefert verbesserte Ergebnisse auf verschiedenen biomedizinischen Datensätzen. Umfassende Experimente mit MSRF-Net zeigen, dass die vorgeschlagene Methode die state-of-the-art-Methoden der biomedizinischen Bildsegmentierung auf vier öffentlich verfügbaren Datensätzen übertrifft. Wir erzielen Dice-Koeffizienten von 0,9217, 0,9420, 0,9224 und 0,8824 auf den Datensätzen Kvasir-SEG, CVC-ClinicDB, dem Data Science Bowl 2018 und der ISIC-2018-Hautläsionen-Segmentierungs-Challenge, jeweils. Zusätzlich führen wir Generalisierbarkeitstests durch und erreichen Dice-Koeffizienten von 0,7921 und 0,7575 auf CVC-ClinicDB und Kvasir-SEG.