UCTransNet: Rethinking the Skip Connections in U-Net from a Channel-wise Perspective with Transformer Übersetzung: UCTransNet: Neubetrachtung der Übersprungverbindungen in U-Net aus kanalbasierter Sicht mit Transformer

Die meisten aktuellen Methoden für semantische Segmentierung verwenden ein U-Net-Framework mit einer Encoder-Decoder-Architektur. Es bleibt jedoch eine Herausforderung, den globalen Multi-Skalen-Kontext mit einem U-Net und einem einfachen Skip-Connection-Schema zu modellieren: 1) Nicht jede Skip-Connection-Einstellung ist effektiv aufgrund des Problems unkompatibler Featuremengen in der Encoder- und Decoder-Stufe; manche Skip-Connections beeinträchtigen sogar die Segmentierungsleistung negativ; 2) Das originale U-Net erzielt auf einigen Datensätzen schlechtere Ergebnisse als eine Architektur ohne Skip-Connections. Auf Basis unserer Erkenntnisse schlagen wir ein neues Segmentierungsframework vor, das UCTransNet (mit dem vorgeschlagenen CTrans-Modul im U-Net), welches aus kanalbasierter Perspektive mit Aufmerksamkeitsmechanismus arbeitet. Insbesondere ist das CTrans-Modul eine Alternative zu den Skip-Connections des U-Nets und besteht aus einem Untermodul zur Durchführung der Multi-Skalen-Kanal-Cross-Fusion mit Transformer (CCT genannt) sowie einem Untermodul zur kanalweisen Cross-Aufmerksamkeit (CCA genannt), um die gefusionierten Multi-Skalen-Kanalinformationen effektiv mit den Decoder-Features zu verbinden, um Unsicherheiten zu beseitigen. Daher kann die vorgeschlagene Verbindung, bestehend aus CCT und CCA, die ursprüngliche Skip-Connection ersetzen, um semantische Lücken zu überbrücken und eine präzise automatische medizinische Bildsegmentierung sicherzustellen. Die experimentellen Ergebnisse deuten darauf hin, dass unser UCTransNet eine genauere Segmentierungsleistung erzielt und konsistente Verbesserungen gegenüber dem Stand der Technik in Bezug auf semantische Segmentierung auf verschiedenen Datensätzen und herkömmlichen Architekturen, die Transformer oder U-förmige Frameworks beinhalten, erreicht. Code: https://github.com/McGregorWwww/UCTransNet.