Mehrschichtiges Kontextgating eingebetteten kollektiven Wissens für die medizinische Bildsegmentierung

Die Segmentierung medizinischer Bilder ist aufgrund der starken anatomischen Variabilität zwischen verschiedenen Fällen äußerst herausfordernd. In jüngster Zeit haben Fortschritte in Deep-Learning-Architekturen eine schnellere und genauere Leistung bei der Bildsegmentierung ermöglicht. Unter den bestehenden Netzwerken hat sich U-Net erfolgreich in der Segmentierung medizinischer Bilder bewährt. In diesem Artikel stellen wir eine Erweiterung von U-Net für die Segmentierung medizinischer Bilder vor, bei der wir die Stärken von U-Net, Squeeze-and-Excitation-(SE)-Blöcken, bidirektionalen ConvLSTMs (BConvLSTM) sowie dem Mechanismus dichter Konvolutionen voll ausnutzen. (I) Wir verbessern die Segmentierungsgenauigkeit durch die Integration von SE-Blöcken innerhalb des U-Net, wobei der Einfluss auf die Modellkomplexität gering bleibt. Diese Blöcke passen die kanalweisen Merkmalsantworten adaptiv an, indem sie ein selbststeuerndes Gating-Mechanismus basierend auf der globalen Informationsebene der Merkmalskarten nutzen. (II) Um die Merkmalspropagation zu stärken und die Wiederverwendung von Merkmalen zu fördern, verwenden wir dicht verbundene Konvolutionen in der letzten konvolutionellen Schicht des Encoder-Pfads. (III) Anstelle einer einfachen Verkettung in den Skip-Verbindungen von U-Net setzen wir BConvLSTM in allen Netzwerkebenen ein, um die aus dem entsprechenden Encoder-Pfad und der vorherigen Decoder-Up-Konvolution gewonnenen Merkmalskarten nichtlinear zu kombinieren. Das vorgeschlagene Modell wird an sechs Datensätzen – DRIVE, ISIC 2017 und 2018, Lungensegmentierung, $PH^2$ sowie Zellkernsegmentierung – evaluiert und erreicht dabei Spitzenleistungen im Vergleich zu aktuellen Methoden.