HyperAIHyperAI
vor 11 Tagen

Medizinische Bildsegmentierung mittels kaskadierter Aufmerksamkeitsdekodierung

{Radu Marculescu, Md Mostafijur Rahman}
Medizinische Bildsegmentierung mittels kaskadierter Aufmerksamkeitsdekodierung
Abstract

Transformers haben aufgrund ihrer Fähigkeit, über Selbst-Attention langreichweitige Abhängigkeiten zu erfassen, großes Versprechen in der medizinischen Bildsegmentierung gezeigt. Sie fehlt jedoch die Fähigkeit, lokale (kontextuelle) Beziehungen zwischen Pixeln zu lernen. Frühere Ansätze versuchen, dieses Problem zu überwinden, indem sie konvolutionale Schichten entweder im Encoder- oder Decoder-Modul von Transformers integrieren, was jedoch gelegentlich zu inkonsistenten Merkmalen führt. Um dieses Problem anzugehen, schlagen wir einen neuartigen, auf Aufmerksamkeit basierenden Decoder vor, den wir CASCaded Attention DEcoder (CASCADE) nennen. CASCADE nutzt die mehrskaligen Merkmale hierarchischer Vision-Transformers und besteht aus i) einem Aufmerksamkeits-Gate, das Merkmale mittels Skip-Verbindungen fusioniert, und ii) einem konvolutionellen Aufmerksamkeits-Modul, das sowohl langreichweitige als auch lokale Kontextinformationen durch Unterdrückung von Hintergrundinformationen verstärkt. Aufgrund ihrer schnelleren Konvergenz und besseren Leistung verwenden wir einen mehrstufigen Merkmals- und Verlust-Aggregationsansatz. Unsere Experimente zeigen, dass Transformers mit CASCADE die derzeit besten CNN- und Transformer-basierten Ansätze deutlich übertreffen und dabei bis zu 5,07 % und 6,16 % Verbesserungen in den DICE- und mIoU-Scores erzielen. CASCADE eröffnet neue Wege zur Gestaltung effizienter, auf Aufmerksamkeit basierender Decoder.

Medizinische Bildsegmentierung mittels kaskadierter Aufmerksamkeitsdekodierung | Neueste Forschungsarbeiten | HyperAI