HyperAIHyperAI
vor 17 Tagen

Dual Cross-Attention für die medizinische Bildsegmentierung

Gorkem Can Ates, Prasoon Mohan, Emrah Celik
Dual Cross-Attention für die medizinische Bildsegmentierung
Abstract

Wir stellen Dual Cross-Attention (DCA) vor, ein einfaches jedoch wirksames Aufmerksamkeitsmodul, das die Skip-Verbindungen in U-Net-basierten Architekturen für die medizinische Bildsegmentierung verbessern kann. DCA schließt die semantische Lücke zwischen Encoder- und Decoder-Features, indem es sequenziell kanal- und raumbezogene Abhängigkeiten über mehrskalige Encoder-Features erfasst. Zunächst extrahiert das Channel Cross-Attention (CCA)-Modul globale kanalweise Abhängigkeiten durch die Anwendung von Cross-Attention über Kanal-Tokens mehrskaliger Encoder-Features. Anschließend wendet das Spatial Cross-Attention (SCA)-Modul Cross-Attention an, um raumbezogene Abhängigkeiten über räumliche Tokens zu erfassen. Schließlich werden diese feinkörnigen Encoder-Features hochskaliert und mit ihren entsprechenden Decoder-Abschnitten verbunden, um ein Skip-Connection-Schema zu bilden. Das vorgeschlagene DCA-Modul lässt sich in beliebige Encoder-Decoder-Architekturen mit Skip-Verbindungen, wie beispielsweise U-Net und deren Varianten, integrieren. Wir testen unser DCA-Modul, indem wir es in sechs U-Net-basierte Architekturen integrieren: U-Net, V-Net, R2Unet, ResUnet++, DoubleUnet und MultiResUnet. Unser DCA-Modul zeigt auf den Datensätzen GlaS, MoNuSeg, CVC-ClinicDB, Kvasir-Seg und Synapse Verbesserungen des Dice-Scores von bis zu 2,05 %, 2,74 %, 1,37 %, 1,12 % und 1,44 % jeweils. Die Quellcodes sind unter folgender Adresse verfügbar: https://github.com/gorkemcanates/Dual-Cross-Attention

Dual Cross-Attention für die medizinische Bildsegmentierung | Neueste Forschungsarbeiten | HyperAI