Adaptation des réseaux de neurones pour l'estimation des effets de traitement

Ce document traite de l'utilisation des réseaux de neurones pour estimer les effets du traitement à partir de données observationnelles. Généralement, l'estimation se déroule en deux étapes. Premièrement, nous ajustons des modèles pour l'issue attendue et la probabilité de traitement (score de propension) pour chaque unité. Deuxièmement, nous intégrons ces modèles ajustés dans un estimateur en aval de l'effet. Les réseaux de neurones sont une option naturelle pour les modèles de la première étape. La question que nous abordons est : comment pouvons-nous adapter la conception et l'entraînement des réseaux de neurones utilisés lors de cette première étape afin d'améliorer la qualité de l'estimation finale de l'effet du traitement ? Nous proposons deux adaptations basées sur des observations tirées de la littérature statistique sur l'estimation des effets du traitement. La première est une nouvelle architecture, le Dragonnet, qui exploite la suffisance du score de propension pour l'ajustement de l'estimation. La seconde est une procédure de régularisation, appelée régularisation ciblée, qui induit un biais vers des modèles possédant des propriétés asymptotiques optimales non paramétriques dès leur conception. Des études sur des jeux de données standards pour l'inférence causale montrent que ces adaptations surpassent les méthodes existantes. Le code est disponible sur github.com/claudiashi57/dragonnet.