Évaluation des réseaux génératifs adverses convolutionnels profonds pour l’augmentation de données d’images radiographiques thoraciques

Les jeux de données d’images médicales sont généralement déséquilibrés en raison des coûts élevés liés à l’acquisition des données et du temps nécessaire pour les annoter. Former des modèles de réseaux de neurones profonds sur de tels jeux de données afin de classifier avec précision les états médicaux ne donne pas toujours des résultats satisfaisants et conduit souvent à un surajustement sur les échantillons de la classe majoritaire. Afin de remédier à ce problème, une augmentation de données est souvent appliquée aux données d’entraînement à l’aide de techniques d’augmentation géométrique telles que le redimensionnement, le découpage, le retournement, le remplissage, la rotation, la translation, la transformation affine, ainsi que des techniques d’augmentation colorimétrique telles que la luminosité, le contraste, la saturation et la teinte, afin d’élargir la taille du jeu de données. Toutefois, ces techniques d’augmentation ne sont pas nécessairement bénéfiques dans des domaines à données limitées, en particulier pour les images médicales, et peuvent même aggraver le surajustement. Dans ce travail, nous avons réalisé une augmentation de données sur le jeu de données de radiographies thoraciques à l’aide d’un modèle génératif (réseau génératif adversaire convolutif profond) qui produit des instances artificielles conservant des caractéristiques similaires aux données d’origine. L’évaluation du modèle a permis d’obtenir un score de distance de Fréchet Inception (FID) de 1,289.