Évaluation de la réalisme clinique des radiographies thoraciques synthétiques générées à l’aide de GAN à croissance progressive

Les radiographies thoraciques constituent un outil essentiel dans l’évaluation de nombreux patients. Comme la plupart des modalités d’imagerie médicale, elles sont profondément multi-modales et permettent de visualiser une grande variété de combinaisons de pathologies. Une quantité croissante de données annotées est nécessaire pour développer de nouveaux outils diagnostiques, mais cela entre en conflit direct avec les préoccupations liées à la confidentialité des patients, qui limitent l’accès aux données par des demandes de permission et des approbations éthiques. Des travaux antérieurs ont tenté de répondre à ces préoccupations en concevant des GAN spécifiques à une classe afin de synthétiser des images et enrichir les jeux de données d’entraînement. Toutefois, ces approches ne sont pas évolutives, car elles introduisent des compromis computationnels entre la taille du modèle et le nombre de classes, imposant ainsi des limites fixes à la qualité des images générées. Nous abordons cette limitation en proposant une optimisation latente des classes, permettant un échantillonnage efficace et multi-modal à partir d’un GAN, et nous utilisons cette méthode pour synthétiser un vaste archivage d’images annotées. Nous appliquons un PGGAN à la tâche de synthèse non supervisée de radiographies thoraciques, et faisons évaluer par des radiologues la réalisme clinique des échantillons générés. Nous fournissons une analyse approfondie des caractéristiques des différentes pathologies observées sur les images générées, ainsi qu’un aperçu de la diversité des maladies capturée par le modèle. Nous validons l’application de la distance de Fréchet Inception (FID) pour mesurer la qualité des images générées, et constatons qu’elle est comparable à celle obtenue dans d’autres tâches à haute résolution. Nous quantifions le réalisme clinique des radiographies générées en demandant aux radiologues de distinguer les examens réels des faux, et constatons que les images synthétiques sont plus susceptibles d’être classées comme réelles que par hasard, bien qu’un progrès reste nécessaire pour atteindre un réalisme véritable. Ces résultats sont confirmés par l’évaluation de la performance d’un modèle de classification synthétique sur des données réelles. En conclusion, nous discutons des limites des images générées par PGGAN et proposons des pistes pour atteindre des générations contrôlables et réalistes.