Inférence des effets causaux avec des modèles à variables latentes profondes

L'apprentissage des effets causaux au niveau individuel à partir de données observationnelles, tel que l'inférence du médicament le plus efficace pour un patient spécifique, est un problème d'une importance croissante pour les décideurs politiques. L'aspect le plus crucial de l'inférence des effets causaux à partir de données observationnelles est la gestion des facteurs de confusion, c'est-à-dire des éléments qui influencent à la fois une intervention et son résultat. Une étude observationnelle soigneusement conçue tente de mesurer tous les facteurs de confusion importants. Cependant, même si l'on n'a pas un accès direct à tous les facteurs de confusion, il peut exister des mesures bruyantes et incertaines de proxies pour ces facteurs. Nous nous appuyons sur les récentes avancées en modélisation de variables latentes pour estimer simultanément l'espace latent inconnu résumant les facteurs de confusion et l'effet causal. Notre méthode repose sur les Autoencodeurs Variationnels (VAE) qui suivent la structure causale de l'inférence avec des proxies. Nous démontrons que notre méthode est considérablement plus robuste que les méthodes existantes et qu'elle égale l'état de l'art sur les benchmarks précédents axés sur les effets individuels des traitements.