Apprentissage profond de représentations pour l'estimation de l'effet personnalisé d'un traitement à l'aide de dossiers de santé électroniques
L’utilisation de données observationnelles cliniques pour estimer les effets de traitement individualisés (ITE) constitue une tâche difficile, en raison de la présence inévitable de biais de confusion dans les données cliniques. La plupart des modèles existants pour l’estimation des ITE tentent de résoudre ce problème en construisant des estimateurs non biaisés des effets de traitement. Bien que précieux, l’apprentissage d’une représentation équilibrée peut parfois entrer en conflit direct avec l’objectif d’apprendre un modèle efficace et discriminant pour l’estimation des ITE. Nous proposons un nouveau modèle hybride combinant apprentissage profond multi-tâches et algorithmes des k plus proches voisins (KNN) pour l’estimation des ITE. Plus précisément, le modèle proposé utilise d’abord l’apprentissage profond multi-tâches pour extraire à la fois des représentations latentes prédictives des résultats et spécifiques au traitement à partir des dossiers de santé électroniques (EHR), en effectuant simultanément la prédiction des résultats et la classification de la catégorie de traitement. Ensuite, nous estimons les résultats contrefactuels à l’aide de l’algorithme KNN basé sur les représentations cachées apprises. Nous validons le modèle proposé sur un jeu de données semi-simulées largement utilisées, à savoir IHDP, ainsi que sur un jeu de données cliniques réelles comprenant 736 patients atteints d’insuffisance cardiaque (HF). Les performances de notre modèle restent robustes, atteignant respectivement 1,7 et 0,23 en termes d’erreur quadratique moyenne de l’estimation de l’effet hétérogène (PEHE) et d’effet de traitement moyen (ATE) sur le jeu de données IHDP, et 0,703 et 0,796 en précision et score F1 respectivement sur le jeu de données HF. Les résultats démontrent que le modèle proposé atteint des performances compétitives par rapport aux modèles de pointe. En outre, les résultats révèlent plusieurs observations conformes aux connaissances établies dans le domaine médical, ainsi que certaines hypothèses suggestives pouvant être validées par des investigations ultérieures en contexte clinique.