Prédiction des résultats cliniques à partir des notes d'admission en utilisant l'intégration de connaissances auto-supervisée

La prédiction des résultats à partir de textes cliniques peut prévenir les médecins de négliger des risques possibles et aider les hôpitaux à planifier leurs capacités. Nous simulons les patients au moment de leur admission, lorsque le soutien à la décision est particulièrement précieux, et contribuons à une nouvelle tâche d'admission à la sortie avec quatre objectifs courants de prédiction des résultats : diagnostics à la sortie, procédures effectuées, mortalité en milieu hospitalier et prédiction de la durée du séjour. Le système idéal devrait inférer les résultats en fonction des symptômes, des conditions préexistantes et des facteurs de risque du patient. Nous évaluons l'efficacité des modèles linguistiques pour gérer cette situation et proposons un pré-entraînement sur les résultats cliniques afin d'intégrer les connaissances sur les résultats des patients provenant de multiples sources publiques. Nous présentons également une méthode simple pour incorporer la hiérarchie des codes ICD (ICD code hierarchy) dans les modèles. Nous montrons que notre approche améliore les performances sur les tâches de prédiction des résultats par rapport à plusieurs points de référence. Une analyse détaillée révèle d'autres forces du modèle, notamment sa transférabilité, mais aussi ses faiblesses, telles que la gestion des valeurs vitales et les incohérences dans les données sous-jacentes.