HistoSeg: Schnelle Aufmerksamkeit mit Multi-Loss-Funktion für die Segmentierung mehrerer Strukturen in digitalen Histologiebildern

Die Segmentierung medizinischer Bilder unterstützt die computerunterstützte Diagnose, chirurgische Eingriffe und Therapien. Digitale Gewebeschnittbilder werden zur Analyse und Segmentierung von Drüsen, Zellkernen und anderen Biomarkern genutzt, die anschließend in computerunterstützten medizinischen Anwendungen eingesetzt werden. Dazu haben zahlreiche Forscher unterschiedliche neuronale Netze entwickelt, um die Segmentierung histologischer Bilder durchzuführen, wobei die meisten dieser Netze auf einer Encoder-Decoder-Architektur basieren und komplexe Aufmerksamkeitsmodule oder Transformer nutzen. Dennoch sind diese Netzwerke weniger genau darin, relevante lokale und globale Merkmale mit präziser Randdetektion auf mehreren Skalen zu erfassen. Daher schlagen wir ein Encoder-Decoder-Netzwerk mit einem schnellen Aufmerksamkeitsmodul (Quick Attention Module) sowie einer Multi-Loss-Funktion (Kombination aus binärer Kreuzentropie (BCE)-Verlust, Focal Loss und Dice-Loss) vor. Wir evaluieren die Generalisierungsfähigkeit unseres vorgeschlagenen Netzwerks an zwei öffentlich verfügbaren Datensätzen für die medizinische Bildsegmentierung, MoNuSeg und GlaS, und erreichen gegenüber den aktuellen State-of-the-Art-Netzwerken eine Verbesserung um 1,99 % auf dem MoNuSeg-Datensatz und um 7,15 % auf dem GlaS-Datensatz. Der Implementierungscode ist unter folgendem Link verfügbar: https://bit.ly/HistoSeg