Adversariales Lernen zur Verzerrung für die Rauschreduzierung in medizinischen Bildern

Wir präsentieren eine neuartige adversäre Verzerrungslernen (Adversarial Distortion Learning, ADL) zur Entstörung von zweidimensionalen und dreidimensionalen (2D/3D) biomedizinischen Bilddaten. Das vorgeschlagene ADL besteht aus zwei Auto-Encodern: einem Entstörer und einem Diskriminator. Der Entstörer entfernt Rauschen aus den Eingabedaten, während der Diskriminator das entstörte Ergebnis mit seiner rauschfreien Gegenstück vergleicht. Dieser Prozess wird wiederholt, bis der Diskriminator das entstörte Daten nicht mehr von dem Referenzdatensatz unterscheiden kann. Sowohl der Entstörer als auch der Diskriminator basieren auf einem vorgeschlagenen Auto-Encoder namens Efficient-Unet. Efficient-Unet verfügt über eine leichte Architektur, die Residualblöcke und einen neuen pyramidalen Ansatz im Backbone verwendet, um Merkmalskarten effizient zu extrahieren und zu wiederverwenden. Während des Trainings werden die texturale Information und der Kontrast durch zwei neuartige Verlustfunktionen gesteuert. Die Architektur von Efficient-Unet ermöglicht es, die vorgeschlagene Methode auf beliebige Arten von biomedizinischen Daten zu verallgemeinern. Die 2D-Version unseres Netzes wurde auf ImageNet trainiert und auf biomedizinischen Datensätzen getestet, deren Verteilung vollständig anders ist als die von ImageNet; daher ist kein erneutes Training erforderlich. Experimentelle Ergebnisse, die anhand von Magnetresonanztomografie (MRT), Dermatoskopie, Elektronenmikroskopie und Röntgenbild-Datensätzen durchgeführt wurden, zeigen, dass die vorgeschlagene Methode in jedem Benchmark die besten Ergebnisse erzielte. Unsere Implementierung und vortrainierte Modelle sind unter https://github.com/mogvision/ADL verfügbar.