RETAIN : Un modèle prédictif interprétable pour les soins de santé utilisant un mécanisme d'attention inverse dans le temps

La précision et l'interprétabilité sont deux caractéristiques dominantes des modèles prédictifs réussis. Généralement, un choix doit être fait en faveur de modèles complexes et opaques tels que les réseaux de neurones récurrents (RNN) pour la précision, par opposition aux modèles traditionnels moins précis mais plus interprétables, comme la régression logistique. Ce compromis pose des défis dans le domaine médical où la précision et l'interprétabilité sont toutes deux importantes. Nous avons relevé ce défi en développant le modèle d'Attention Temporelle Inversée (REverse Time AttentIoN model - RETAIN) pour son application aux données des Dossiers Médicaux Électroniques (EHR). RETAIN atteint une haute précision tout en restant cliniquement interprétable et est basé sur un modèle d'attention neuronale à deux niveaux qui détecte les visites passées influentes et les variables cliniques significatives au sein de ces visites (par exemple, diagnostics clés). RETAIN imite la pratique des médecins en examinant les données EHR dans un ordre temporel inverse, de sorte que les visites cliniques récentes ont tendance à recevoir une attention plus importante. RETAIN a été testé sur un grand ensemble de données EHR d'un système de santé comprenant 14 millions de visites effectuées par 263 000 patients sur une période de 8 ans, et a démontré une précision prédictive et une scalabilité computationnelle comparables aux méthodes de pointe telles que les RNN, ainsi qu'une facilité d'interprétation comparable aux modèles traditionnels.