Mehrfache Imputation mittels verketteter Gleichungen: Probleme und Anleitung für die praktische Anwendung
{Ian R. White Patrick Royston Angela M. Wood}
Abstract
Multiple Imputation by Chained Equations (MICE) ist ein flexibler und praktischer Ansatz zur Behandlung fehlender Daten. Wir erläutern die Grundprinzipien der Methode und zeigen, wie kategoriale und quantitative Variablen – einschließlich schief verteilter Variablen – imputiert werden können. Wir geben Anleitung zur Spezifikation des Imputationsmodells und zur Bestimmung der erforderlichen Anzahl von Imputationen. Wir beschreiben die praktische Analyse mehrfach imputierter Daten, einschließlich Modellbildung und Modellüberprüfung. Wir betonen die Grenzen der Methode und diskutieren mögliche Fallstricke. Die Konzepte werden anhand eines Datensatzes aus dem Bereich der psychischen Gesundheit veranschaulicht, wobei Stata-Code-Ausschnitte bereitgestellt werden.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| multivariate-time-series-imputation-on | MICE | MAE (PM2.5): 27.42 |
| multivariate-time-series-imputation-on-1 | MICE | MAE (10% of data as GT): 0.634 |
| multivariate-time-series-imputation-on-kdd | MICE | MSE (10% missing): 0.468 |
| multivariate-time-series-imputation-on-uci | MICE | MAE (10% missing): 0.477 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.