HyperAIHyperAI
vor 3 Monaten

ColonFormer: Eine effiziente Transformer-basierte Methode zur Segmentierung von Kolonpolypen

Nguyen Thanh Duc, Nguyen Thi Oanh, Nguyen Thi Thuy, Tran Minh Triet, Dinh Viet Sang
ColonFormer: Eine effiziente Transformer-basierte Methode zur Segmentierung von Kolonpolypen
Abstract

Die Erkennung von Polypen stellt eine Herausforderung für die automatisierte Analyse endoskopischer Bilder in computerunterstützten klinischen Systemen dar. Modelle basierend auf konvolutionellen neuronalen Netzwerken (CNN), Transformers und deren Kombinationen wurden vorgeschlagen, um Polypen mit vielversprechenden Ergebnissen zu segmentieren. Dennoch weisen diese Ansätze entweder Einschränkungen bei der Modellierung der lokalen Erscheinung von Polypen auf oder fehlen an mehrstufigen Merkmalen zur Erfassung räumlicher Abhängigkeiten im Dekodierungsprozess. In dieser Arbeit wird ein neuartiges Netzwerk namens ColonFormer vorgestellt, um diese Limitationen zu überwinden. ColonFormer ist eine Encoder-Decoder-Architektur, die in der Lage ist, langreichweitige semantische Informationen sowohl im Encoder- als auch im Decoder-Zweig zu modellieren. Der Encoder basiert auf einer leichtgewichtigen Architektur, die auf Transformers beruht und globale semantische Beziehungen auf mehreren Skalen erfasst. Der Decoder ist eine hierarchische Netzwerkstruktur, die darauf ausgelegt ist, mehrstufige Merkmale zu lernen, um die Merkmalsrepräsentation zu verbessern. Zudem wurde ein Nachbearbeitungsmodul mit einer neuen Skip-Connection-Technik hinzugefügt, um die Grenzen von Polypenobjekten in der globalen Karte präzise zu verfeinern und somit eine genaue Segmentierung zu ermöglichen. Umfassende Experimente wurden auf fünf gängigen Benchmark-Datensätzen für die Polypen-Segmentierung durchgeführt, darunter Kvasir, CVC-Clinic DB, CVC-ColonDB, CVC-T und ETIS-Larib. Die experimentellen Ergebnisse zeigen, dass unser ColonFormer auf allen Benchmark-Datensätzen andere state-of-the-art-Methoden übertrifft.