HyperAIHyperAI
il y a 2 mois

MIMIC-Extract : Un pipeline d’extraction, de prétraitement et de représentation de données pour MIMIC-III

Shirly Wang; Matthew B. A. McDermott; Geeticka Chauhan; Michael C. Hughes; Tristan Naumann; Marzyeh Ghassemi
MIMIC-Extract : Un pipeline d’extraction, de prétraitement et de représentation de données pour MIMIC-III
Résumé

L'apprentissage automatique robuste repose sur l'accès à des données qui peuvent être utilisées avec des cadres standardisés pour des tâches importantes et la capacité de développer des modèles dont les performances peuvent être raisonnablement reproduites. Dans le domaine de l'apprentissage automatique appliqué à la santé, la communauté fait face à des défis de reproductibilité en raison du manque de données accessibles au public et du manque de cadres standardisés pour le traitement des données. Nous présentons MIMIC-Extract, un pipeline open source permettant de transformer les données brutes des dossiers médicaux électroniques (DME) concernant les patients en soins intensifs, contenues dans la base de données publiquement disponible MIMIC-III, en tableaux de données directement utilisables dans les pipelines d'apprentissage automatique courants. MIMIC-Extract répond à trois défis principaux pour rendre les données complexes des dossiers médicaux accessibles à la communauté plus large de l'apprentissage automatique. Premièrement, il fournit des fonctions de traitement des données standardisées, incluant la conversion d'unités, la détection d'outliers et l'agrégation de caractéristiques sémantiquement équivalentes, ce qui permet de gérer les doublons et réduit les valeurs manquantes. Deuxièmement, il préserve la nature sérielle temporelle des données cliniques et peut être facilement intégré aux tâches de prédiction cliniquement actionnables dans l'apprentissage automatique appliqué à la santé. Enfin, il est hautement extensible afin que d'autres chercheurs travaillant sur des questions connexes puissent facilement utiliser le même pipeline. Nous démontrons l'utilité de ce pipeline en présentant plusieurs tâches基准 (benchmark) et résultats baselines.

MIMIC-Extract : Un pipeline d’extraction, de prétraitement et de représentation de données pour MIMIC-III | Articles de recherche récents | HyperAI