Histogramme der orientierten Gradienten trifft tiefes Lernen: Ein neues mehrfachaufgabenfähiges tiefes Netzwerk für die semantische Segmentierung medizinischer Bilder

Wir präsentieren unsere neuartige Methode des tiefen Multi-Task-Learnings für die medizinische Bildsegmentierung. Bestehende Multi-Task-Methoden erfordern Grundwahrheitsannotierungen sowohl für die Hauptaufgabe als auch für die Nebenaufgabe. Im Gegensatz dazu schlagen wir vor, die Pseudolabels der Nebenaufgabe auf unsupervisierte Weise zu generieren. Um die Pseudolabels zu erzeugen, nutzen wir das Histogramm von orientierten Gradienten (HOGs), eine der am häufigsten verwendeten und leistungsfähigsten manuell gestalteten Merkmale für die Detektion. Zusammen mit den Grundwahrheits-Semantiksegmentierungsmasken für die Hauptaufgabe und den Pseudolabels für die Nebenaufgabe lernen wir die Parameter des tiefen Netzes, um den Verlust sowohl der Hauptaufgabe als auch der Nebenaufgabe gemeinsam zu minimieren. Wir haben unsere Methode auf zwei leistungsfähigen und weit verbreiteten Semantiksegmentierungsnetworks angewendet: UNet und U2Net, um im Multi-Task-Setup zu trainieren. Um unsere Hypothese zu validieren, haben wir Experimente an zwei verschiedenen medizinischen Bildsegmentierungsdatensätzen durchgeführt. Aus umfangreichen quantitativen und qualitativen Ergebnissen können wir beobachten, dass unsere Methode konsistent bessere Leistungen zeigt im Vergleich zur Gegenpart-Methode. Darüber hinaus ist unsere Methode der Gewinner des FetReg Endovis Sub-Challenges zur Semantiksegmentierung, der im Rahmen des MICCAI 2021 organisiert wurde.