Imputation multiple par équations chaînées : problèmes et lignes directrices pour la pratique
L'imputation multiple par équations imbriquées (MICE) est une approche souple et pratique pour traiter les données manquantes. Nous exposons les principes de la méthode et montrons comment imputer des variables catégorielles et quantitatives, y compris des variables asymétriques. Nous fournissons des recommandations sur la spécification du modèle d'imputation ainsi que sur le nombre d’imputations nécessaires. Nous décrivons la mise en œuvre pratique de l’analyse des données imputées multiples, incluant la construction de modèles et le contrôle de leur validité. Nous soulignons les limites de la méthode et discutons des pièges potentiels. Nous illustrons ces concepts à l’aide d’un jeu de données en santé mentale, en fournissant des extraits de code Stata.