HyperAIHyperAI
il y a 11 jours

Apprentissage de représentations patientes bout-à-bout par équilibrage auto-supervisé des covariables pour l'estimation causale de l'effet du traitement

{Beau Norgeot, Jingpu Shi, Stefanos Giampanis, Gino Tesei}
Résumé

Un effet causal peut être défini comme une comparaison des résultats issus de deux ou plusieurs actions alternatives, parmi lesquelles seul un seul couple action-résultat est effectivement observé. Dans le domaine de la santé, le standard de référence pour la mesure des effets causaux est constitué par les essais contrôlés randomisés (RCT), dans lesquels une population cible est explicitement définie et chaque individu de l’échantillon est attribué aléatoirement à un groupe de traitement ou à un groupe témoin. Le potentiel considérable de tirer des informations exploitables à partir de relations causales a suscité un volume croissant de recherches en apprentissage automatique visant à appliquer des estimateurs d’effets causaux à des données d’observation dans les domaines de la santé, de l’éducation et de l’économie. La différence principale entre les études d’effets causaux fondées sur des données d’observation et les RCT réside dans le fait que, pour les données d’observation, l’étude a lieu après l’attribution du traitement, de sorte que nous n’avons pas de contrôle sur le mécanisme d’attribution du traitement. Cela peut entraîner des écarts importants dans les distributions des covariables entre les échantillons traités et non traités, rendant la comparaison des effets causaux biaisée et peu fiable. Les approches classiques ont cherché à résoudre ce problème de manière fragmentaire, en prédisant d’abord l’attribution du traitement, puis en estimant séparément l’effet du traitement. Des travaux récents ont étendu une partie de ces approches à une nouvelle famille d’algorithmes d’apprentissage de représentations, démontrant que la borne supérieure de l’erreur d’estimation de l’effet du traitement est déterminée par deux facteurs : l’erreur de généralisation des résultats associée à la représentation, et la distance entre les distributions des groupes traités et non traités induites par cette représentation. Afin de minimiser la dissimilarité dans l’apprentissage de ces distributions, nous proposons dans ce travail un objectif spécifique d’équilibrage automatique et d’apprentissage auto-supervisé. Des expériences menées sur des jeux de données réels et standards ont montré que notre approche produit systématiquement des estimations moins biaisées que les méthodes d’état de l’art précédemment publiées. Nous démontrons que la réduction de l’erreur peut être directement attribuée à la capacité d’apprendre des représentations qui réduisent explicitement cette dissimilarité ; en outre, dans le cas de violations de l’hypothèse de positivité (fréquente dans les données d’observation), nous montrons que notre méthode surpasse significativement l’état de l’art antérieur. Ainsi, en apprenant des représentations qui induisent des distributions similaires entre les groupes traités et non traités, nous fournissons des preuves en faveur de l’hypothèse selon laquelle la dissimilarité des distributions influence la borne d’erreur, tout en proposant un nouveau modèle d’état de l’art pour l’estimation des effets causaux.

Apprentissage de représentations patientes bout-à-bout par équilibrage auto-supervisé des covariables pour l'estimation causale de l'effet du traitement | Articles de recherche récents | HyperAI