HyperAIHyperAI
il y a 2 mois

Estimation des données manquantes dans les flux de données temporelles à l'aide de réseaux neuronaux récurrents multidirectionnels

Jinsung Yoon; William R. Zame; Mihaela van der Schaar
Estimation des données manquantes dans les flux de données temporelles à l'aide de réseaux neuronaux récurrents multidirectionnels
Résumé

La données manquantes constituent un problème omniprésent. Ce défi est particulièrement ardu dans les contextes médicaux, où de nombreuses séries de mesures sont collectées à des moments différents – et souvent irréguliers. Une estimation précise de ces mesures manquantes est cruciale pour diverses raisons, notamment le diagnostic, le pronostic et le traitement. Les méthodes existantes abordent ce problème d'estimation en effectuant une interpolation au sein des séries de données ou une imputation entre les séries de données (toutes deux ignorant des informations importantes) ou en négligeant l'aspect temporel des données et en imposant des hypothèses fortes sur la nature du processus générant les données et/ou sur le schéma des données manquantes (ce qui pose des problèmes particuliers pour les données médicales). Nous proposons une nouvelle approche basée sur une architecture innovante d'apprentissage profond que nous appelons Réseau Neuronal Récurent Multidirectionnel (M-RNN), capable d'interpoler au sein des séries de données et d'imputer entre les séries de données. Nous illustrons la puissance de notre méthode en l'appliquant à cinq jeux de données médicales réels. Nous montrons qu'elle offre une amélioration considérable de l'estimation des mesures manquantes par rapport à 11 références actuelles (y compris l'interpolation spline et cubique, MICE, MissForest, la complétion matricielle et plusieurs méthodes RNN) ; les améliorations typiques en termes d'erreur quadratique moyenne se situent entre 35% et 50%. Des expériences supplémentaires basées sur les mêmes cinq jeux de données démontrent que les améliorations apportées par notre méthode sont extrêmement robustes.

Estimation des données manquantes dans les flux de données temporelles à l'aide de réseaux neuronaux récurrents multidirectionnels | Articles de recherche récents | HyperAI