HyperAIHyperAI
vor 17 Tagen

MedNeXt: Transformer-getriebene Skalierung von ConvNets für die medizinische Bildsegmentierung

Saikat Roy, Gregor Koehler, Constantin Ulrich, Michael Baumgartner, Jens Petersen, Fabian Isensee, Paul F. Jaeger, Klaus Maier-Hein
MedNeXt: Transformer-getriebene Skalierung von ConvNets für die medizinische Bildsegmentierung
Abstract

Es besteht ein explosionsartiges Interesse an der Anwendung von Transformer-basierten Architekturen für die Segmentierung medizinischer Bilder. Allerdings erschwert die fehlende Verfügbarkeit großer, annotierter medizinischer Datensätze die Erreichung von Leistungen, die denen in der Bildverarbeitung natürlicher Bilder entsprechen. Konvolutionelle Netzwerke hingegen weisen eine höhere induktive Bias auf und können daher leichter zu hoher Leistung trainiert werden. Kürzlich versuchte die ConvNeXt-Architektur, die klassische ConvNet-Architektur durch die Nachbildung von Transformer-Blöcken zu modernisieren. In dieser Arbeit verbessern wir diesen Ansatz, um eine modernisierte und skalierbare konvolutionelle Architektur zu entwickeln, die speziell auf die Herausforderungen datenarmen medizinischen Umfelds zugeschnitten ist. Wir stellen MedNeXt vor, ein durch Transformer inspiriertes Netzwerk mit großen Kerneln für die Segmentierung medizinischer Bilder, das folgende Innovationen beinhaltet: 1) Ein vollständig konvolutionelles 3D-Encoder-decoder-Netzwerk auf Basis von ConvNeXt für die Segmentierung medizinischer Bilder, 2) Residuale ConvNeXt-Block-Strukturen für Up- und Downsampling, um semantische Reichhaltigkeit über verschiedene Skalen hinweg zu bewahren, 3) Eine neuartige Technik zur iterativen Erhöhung der Kernelgrößen durch Upsampling von Netzwerken mit kleinen Kerneln, um eine Leistungssättigung bei begrenzten medizinischen Datensätzen zu vermeiden, sowie 4) Eine zusammengesetzte Skalierung auf mehreren Ebenen (Tiefe, Breite, Kernelgröße) innerhalb von MedNeXt. Dies führt zu state-of-the-art-Leistungen bei vier Aufgaben auf CT- und MRT-Modaliäten sowie unterschiedlichen Datensatzgrößen und stellt eine modernisierte tiefe Architektur für die Segmentierung medizinischer Bilder dar. Der Quellcode ist öffentlich unter folgender Adresse verfügbar: https://github.com/MIC-DKFZ/MedNeXt.