DDANet: Dual Decoder Attention Network für die automatische Polypen-Segmentierung

Die Koloskopie gilt als Goldstandard für die Untersuchung und Detektion von Kolorektalpolypen. Die Lokalisierung und Abgrenzung von Polypen kann eine entscheidende Rolle bei der Behandlungsplanung (z. B. chirurgische Planung) und der Prognoseentscheidung spielen. Die Segmentierung von Polypen ermöglicht eine detaillierte Grenzinformation für die klinische Analyse. Convolutional Neural Networks (CNNs) haben die Leistungsfähigkeit bei der Koloskopieanalyse erheblich verbessert. Dennoch weisen Polypen häufig verschiedene Herausforderungen auf, wie intra- und interklassige Variabilität sowie Rauschen. Während die manuelle Markierung von Polypen durch Experten viel Zeit erfordert und anfällig für menschliche Fehler (z. B. Übersehen von Läsionen) ist, kann eine automatisierte, genaue und schnelle Segmentierung die Qualität der abgegrenzten Läsionsgrenzen verbessern und die Rate verpasster Läsionen reduzieren. Die Endotect-Challenge bietet die Möglichkeit, Computer-Vision-Methoden zu benchmarken, indem man auf dem öffentlich verfügbaren Datensatz Hyperkvasir trainiert und auf einem getrennten, bisher nicht gesehenen Datensatz testet. In diesem Beitrag stellen wir eine neuartige Architektur namens „DDANet“ vor, die auf einem Dual-Decoder-Attention-Netzwerk basiert. Unsere Experimente zeigen, dass das auf dem Kvasir-SEG-Datensatz trainierte Modell bei der Bewertung auf einem bisher nicht gesehenen Datensatz einen Dice-Koeffizienten von 0,7874, einen mIoU von 0,7010, eine Recall-Rate von 0,7987 und eine Präzision von 0,8577 erreicht, was die Generalisierungsfähigkeit unseres Modells belegt.