HyperAIHyperAI
vor 2 Monaten

Shallow Attention Network für die Polypensegmentierung

Jun Wei; Yiwen Hu; Ruimao Zhang; Zhen Li; S.Kevin Zhou; Shuguang Cui
Shallow Attention Network für die Polypensegmentierung
Abstract

Genaue Polypensegmentierung ist von großer Bedeutung für die Diagnose von Kolorektalkrebs. Trotzdem bestehen bei der Entwicklung von Polypensegmentierung drei große Herausforderungen, die selbst mit einem leistungsfähigen tiefen Neuronalen Netzwerk nicht vollständig überwunden werden können: (i) Proben, die unter verschiedenen Bedingungen gesammelt wurden, zeigen inkonsistente Farben, was zu einer Lücke in der Merkmalsverteilung und zu Überanpassungsproblemen führt; (ii) Aufgrund wiederholter Merkmalsabtastung werden kleine Polypen leicht degradiert; (iii) Vorder- und Hintergrundpixel sind unbalanciert, was zu einer verzerrten Modellbildung führt.Um diese Probleme anzugehen, schlagen wir das Shallow Attention Network (SANet) für die Polypensegmentierung vor. Insbesondere zur Beseitigung der Farbeffekte haben wir einen Farbaustausch-Algorithmus entwickelt, um den Bildinhalt und die Farbe voneinander zu trennen und das Modell dazu anzuregen, sich stärker auf Form und Struktur des Ziels zu konzentrieren. Darüber hinaus haben wir ein flaches Aufmerksamkeitsmodul (Shallow Attention Module) vorgeschlagen, um das Hintergrundrauschen in flachen Merkmalen herauszufiltern. Dank der hohen Auflösung dieser flachen Merkmale können kleine Polypen korrekt erhalten bleiben.Zudem haben wir während der Inferenzphase eine Wahrscheinlichkeitskorrekturstrategie (Probability Correction Strategy, PCS) entwickelt, um das starke Pixelungleichgewicht bei kleinen Polypen zu mildern. Es sei darauf hingewiesen, dass obwohl PCS nicht in der Trainingsphase verwendet wird, es trotzdem gut bei einem verzerrten Modell funktioniert und die Segmentierungsleistung kontinuierlich verbessert. Quantitative und qualitative Experimenteergebnisse auf fünf anspruchsvollen Benchmarks bestätigen, dass unser vorgeschlagenes SANet erheblich besser als bisherige Methoden der Spitzenklasse abschneidet und eine Geschwindigkeit von etwa 72 FPS erreicht.