DC-UNet: Die U-Net-Architektur neu gedacht mit Dual Channel Efficient CNN für die Segmentierung medizinischer Bilder

In jüngster Zeit ist die tiefe Lernverfahren in der Computer Vision zunehmend populär geworden. Das Convolutional Neural Network (CNN) hat einen Durchbruch in den Bereichen der Bildsegmentierung erzielt, insbesondere bei medizinischen Bildern. In diesem Zusammenhang stellt die U-Net-Architektur die dominierende Methode für Aufgaben der medizinischen Bildsegmentierung dar. Die U-Net zeichnet sich nicht nur durch eine gute Leistung bei der Segmentierung multimodaler medizinischer Bilder im Allgemeinen aus, sondern auch bei anspruchsvollen Spezialfällen. Dennoch haben wir festgestellt, dass die klassische U-Net-Architektur in mehreren Aspekten Grenzen aufweist. Daher haben wir folgende Modifikationen vorgenommen: 1) Entwicklung einer effizienten CNN-Architektur zur Ersetzung des Encoders und Decoders, 2) Einführung eines Residual-Moduls zur Ersetzung der Skip-Verbindungen zwischen Encoder und Decoder, um die Leistung auf Basis des state-of-the-art U-Net-Modells zu verbessern. Auf Basis dieser Verbesserungen haben wir eine neuartige Architektur – DC-UNet – entwickelt, die als potenzieller Nachfolger der U-Net-Architektur in Betracht gezogen werden kann. Dabei haben wir eine neue, effektive CNN-Architektur erstellt und daraufhin die DC-UNet aufgebaut. Wir haben unser Modell anhand von drei Datensätzen mit anspruchsvollen Fällen evaluiert und konnten im Vergleich zur klassischen U-Net eine relative Leistungssteigerung von jeweils 2,90 %, 1,49 % und 11,42 % erzielen. Zudem haben wir die Tanimoto-Ähnlichkeit anstelle der Jaccard-Ähnlichkeit für die Vergleichsrechnung zwischen Grauwertbildern verwendet.