Sous-type de patients par réseaux de neurones LSTM sensibles au temps

Dans l’étude de diverses maladies, l’hétérogénéité entre les patients entraîne généralement des profils de progression différents et peut exiger des interventions thérapeutiques variées. Il est donc essentiel d’étudier la sous-typologie des patients, c’est-à-dire le regroupement des patients en sous-types caractérisant la maladie. La sous-typologie à partir de données complexes relatives aux patients s’avère particulièrement difficile en raison de l’hétérogénéité des informations et des dynamiques temporelles. Le réseau de neurones à mémoire à court et long terme (Long-Short Term Memory, LSTM) a été largement utilisé avec succès dans de nombreux domaines pour traiter des données séquentielles, et a récemment été appliqué à l’analyse de dossiers médicaux longitudinaux. Toutefois, les unités LSTM traditionnelles sont conçues pour traiter des séquences dont les intervalles temporels entre éléments consécutifs sont constants. Étant donné que les intervalles entre deux observations successives dans les dossiers des patients peuvent varier de quelques jours à plusieurs mois, l’architecture classique de LSTM peut conduire à des performances sous-optimales. Dans cet article, nous proposons une nouvelle unité LSTM appelée Time-Aware LSTM (T-LSTM), spécifiquement conçue pour gérer les intervalles irréguliers dans les dossiers longitudinaux des patients. Notre approche apprend une décomposition en sous-espaces de la mémoire cellulaire, permettant ainsi un amortissement temporel qui diminue le contenu de la mémoire en fonction du temps écoulé. Nous proposons également un modèle de sous-typologie des patients qui exploite le T-LSTM dans une architecture d’auto-encodeur afin d’apprendre une représentation compacte et puissante des séries temporelles des patients, utilisée ensuite pour regrouper les patients en sous-types cliniques. Des expériences menées sur des jeux de données synthétiques et réels démontrent que l’architecture T-LSTM proposée parvient à capturer efficacement les structures sous-jacentes présentes dans les séquences présentant des irrégularités temporelles.