Vers la compréhension de la classification des rythmes ECG à l’aide de réseaux de neurones convolutifs et de cartes d’attention

L’accès aux données des dossiers de santé électroniques (DSE) a stimulé des avancées computationnelles dans la recherche médicale. Toutefois, diverses préoccupations, notamment liées à la vie privée, peuvent limiter l’accès aux données DSE ainsi que leur utilisation collaborative. Le partage de données DSE synthétiques pourrait atténuer ces risques. Dans cet article, nous proposons une nouvelle approche, appelée medGAN (réseau génératif adversaire médical), pour générer des dossiers patients synthétiques réalistes. À partir de dossiers patients réels en entrée, medGAN est capable de générer des variables discrètes de haute dimension (par exemple, caractéristiques binaires et de comptage) grâce à une combinaison d’un autoencodeur et de réseaux génératifs adversaires. Nous proposons également une méthode de moyennage par mini-batch pour éviter efficacement le phénomène de « collapse des modes », tout en améliorant l’efficacité d’apprentissage grâce à la normalisation par mini-batch et aux connexions directes (shortcut connections). Pour démontrer la faisabilité de notre méthode, nous montrons que medGAN génère des dossiers patients synthétiques capables d’atteindre des performances comparables aux données réelles sur plusieurs expériences, incluant des statistiques de distribution, des tâches de modélisation prédictive et une évaluation par des experts médicaux. Nous observons également empiriquement un risque limité de divulgation d’identité et de caractéristiques personnelles lors de l’utilisation de medGAN.