HyperAIHyperAI
vor 2 Monaten

MIMIC-Extract: Ein Datenextraktions-, Vorverarbeitungs- und Repräsentationspipeline für MIMIC-III

Shirly Wang; Matthew B. A. McDermott; Geeticka Chauhan; Michael C. Hughes; Tristan Naumann; Marzyeh Ghassemi
MIMIC-Extract: Ein Datenextraktions-, Vorverarbeitungs- und Repräsentationspipeline für MIMIC-III
Abstract

Robustes maschinelles Lernen basiert auf dem Zugang zu Daten, die mit standardisierten Frameworks in wichtigen Aufgaben verwendet werden können, und der Fähigkeit, Modelle zu entwickeln, deren Leistung nachvollziehbar reproduziert werden kann. Im Bereich des maschinellen Lernens für den Gesundheitsdienst steht der Gemeinschaft die Nachvollziehbarkeit aufgrund mangelnden öffentlich zugänglichen Daten und fehlender standardisierter Datenverarbeitungsframeworks in den Weg. Wir stellen MIMIC-Extract vor, eine Open-Source-Pipeline zur Transformation roher elektronischer Patientenakten (EHR) von intensivpflichtigen Patienten, die in der öffentlich zugänglichen MIMIC-III-Datenbank enthalten sind, in Dataframes, die direkt in gängige Pipelines des maschinellen Lernens eingesetzt werden können. MIMIC-Extract begegnet den drei Hauptherausforderungen bei der Bereitstellung komplexer Gesundheitsdaten für die breitere Maschinenlern-Gemeinschaft. Erstens bietet es standardisierte Datenverarbeitungsfunktionen, einschließlich Einheitenkonvertierung, Ausreißererkennung und Aggregation semantisch äquivalenter Merkmale, wodurch Duplikate berücksichtigt und Fehlende Werte reduziert werden. Zweitens bewahrt es die Zeitreihenstruktur klinischer Daten und kann leicht in klinisch relevante Vorhersageaufgaben im maschinellen Lernen für den Gesundheitsdienst integriert werden. Drittens ist es hochgradig erweiterbar, sodass andere Forscher mit ähnlichen Fragestellungen das gleiche Pipeline einfach nutzen können. Die Nützlichkeit dieser Pipeline wird durch die Vorstellung mehrerer Benchmark-Aufgaben und Baseline-Ergebnisse demonstriert.

MIMIC-Extract: Ein Datenextraktions-, Vorverarbeitungs- und Repräsentationspipeline für MIMIC-III | Neueste Forschungsarbeiten | HyperAI