HyperAIHyperAI
vor 2 Monaten

RWKV-UNet: Verbesserung der UNet durch langreichweitige Kooperation für effektive medizinische Bildsegmentierung

Jiang, Juntao ; Zhang, Jiangning ; Liu, Weixuan ; Gao, Muxuan ; Hu, Xiaobin ; Yan, Xiaoxiao ; Huang, Feiyue ; Liu, Yong
RWKV-UNet: Verbesserung der UNet durch langreichweitige Kooperation für effektive medizinische Bildsegmentierung
Abstract

In den letzten Jahren gab es erhebliche Fortschritte im Bereich des tiefen Lernens für die medizinische Bildanalyse, insbesondere mit Faltungsneuronalen Netzen (CNNs) und Transformer-Modellen. Allerdings haben CNNs Schwierigkeiten, langreichweitige Abhängigkeiten zu erfassen, während Transformatoren mit hohen Rechenaufwänden konfrontiert sind. Um diese Herausforderungen zu bewältigen, schlagen wir das RWKV-UNet vor, ein neues Modell, das die RWKV (Receptance Weighted Key Value)-Struktur in die U-Net-Architektur integriert. Diese Integration verbessert die Fähigkeit des Modells, langreichweitige Abhängigkeiten zu erfassen und den kontextuellen Verständnisprozess zu stärken, was für eine genaue Segmentierung von medizinischen Bildern entscheidend ist. Wir entwickeln einen leistungsfähigen Encoder mit invertierten Residual-RWKV-Blöcken (IR-RWKV), die CNNs und RWKVs kombinieren. Zudem schlagen wir ein Cross-Channel-Mix-Modul (CCM) vor, um Skip-Verbindungen durch Multi-Skalen-Feature-Fusion zu verbessern und globale Kanalinformationen zu integrieren. Experimente auf Benchmark-Datensätzen, einschließlich Synapse, ACDC, BUSI, CVC-ClinicDB, CVC-ColonDB, Kvasir-SEG, ISIC 2017 und GLAS zeigen, dass das RWKV-UNet den aktuellen Stand der Technik bei verschiedenen Arten der medizinischen Bildsegmentierung erreicht. Darüber hinaus balancieren kleinere Varianten wie das RWKV-UNet-S und das RWKV-UNet-T Genauigkeit und Recheneffizienz, wodurch sie sich für breitere klinische Anwendungen eignen.