Evaluierung der klinischen Realitätsnähe synthetischer Thorax-Röntgenaufnahmen, die mit progressiv wachsenden GANs generiert wurden

Röntgenaufnahmen der Brust sind ein entscheidendes Instrument bei der Diagnose vieler Patienten. Ähnlich wie die meisten medizinischen Bildgebungstechniken sind sie hochgradig multimodal und ermöglichen die Darstellung einer Vielzahl unterschiedlicher Kombinationen von Erkrankungen. Es besteht ein stetig wachsender Bedarf an größeren Mengen an annotierten Daten zur Entwicklung neuer diagnostischer Werkzeuge; gleichzeitig steht dies jedoch im Widerspruch zu Bedenken hinsichtlich der Patientenvertraulichkeit, die den Zugriff durch Genehmigungsanträge und Ethikgutachten erheblich einschränkt. Frühere Ansätze haben diese Herausforderung durch die Entwicklung klassenspezifischer GANs (Generative Adversarial Networks) angegangen, die künstliche Bilder zur Erweiterung von Trainingsdaten synthetisieren. Diese Verfahren lassen sich jedoch nicht skalieren, da sie zwischen Modellgröße und Anzahl der Klassen einen erheblichen Kompromiss in Bezug auf die Rechenleistung eingehen, was feste Grenzen für die Qualität der generierten Bilder setzt. Wir adressieren dieses Problem durch die Einführung einer latenten Klassenoptimierung, die eine effiziente, multimodale Stichprobenerzeugung aus einer GAN ermöglicht. Mit diesem Ansatz synthetisieren wir eine umfangreiche Sammlung annotierter, künstlicher Röntgenbilder. Wir wenden eine PGGAN (Progressive Growing of GANs) auf die Aufgabe der unsupervisierten Röntgenbildsynthese an und lassen Radiologen die klinische Plausibilität der resultierenden Bilder bewerten. Wir führen eine detaillierte Analyse der Eigenschaften verschiedener Pathologien auf den synthetischen Bildern durch und geben einen Überblick über die Vielfalt der erfassten Krankheitsmuster. Wir validieren die Anwendung der Fréchet-Inception-Distance (FID) zur Bewertung der Qualität der Röntgenbilder und stellen fest, dass die Ergebnisse mit denen anderer hochauflösender Aufgaben vergleichbar sind. Die klinische Realitätsnähe der Bilder quantifizieren wir durch eine Studie, in der Radiologen aufgefordert werden, echte von künstlichen Aufnahmen zu unterscheiden. Die Ergebnisse zeigen, dass die synthetischen Bilder signifikant häufiger als echt klassifiziert werden als zufällig, doch es bleibt noch Verbesserungsbedarf, um echte Realität zu erreichen. Diese Befunde bestätigen wir durch die Bewertung der Leistungsfähigkeit eines synthetisch trainierten Klassifikationsmodells auf echten Scan-Daten. Abschließend diskutieren wir die Grenzen der PGGAN-generierten Bilder und weisen auf Wege hin, um kontrollierbare, realistische Synthesen zu erreichen.