HyperAIHyperAI
il y a 17 jours

Identification de maladies rares à partir de notes cliniques à l’aide d’ontologies et de supervision faible

Hang Dong, Víctor Suárez-Paniagua, Huayu Zhang, Minhong Wang, Emma Whitfield, Honghan Wu
Identification de maladies rares à partir de notes cliniques à l’aide d’ontologies et de supervision faible
Résumé

L’identification des maladies rares à partir de notes cliniques par traitement du langage naturel (NLP) est un défi en raison du faible nombre de cas disponibles pour l’apprentissage automatique ainsi que de la nécessité d’annoter les données par des experts cliniques. Nous proposons une méthode fondée sur l’utilisation d’ontologies et de supervision faible. Cette approche comporte deux étapes : (i) Texte vers UMLS, qui consiste à lier les mentions textuelles à des concepts du Unified Medical Language System (UMLS), en utilisant un outil de liaison d’entités nommées (par exemple, SemEHR) et une supervision faible basée sur des règles personnalisées ainsi que des représentations contextuelles issues de modèles Bidirectionnels à Encodage par Transformateurs (BERT) ; (ii) UMLS vers ORDO, qui consiste à associer les concepts UMLS aux maladies rares de l’Ontologie des Maladies Rares Orphanet (ORDO). À l’aide des résumés de sortie des soins intensifs du corpus MIMIC-III aux États-Unis comme étude de cas, nous démontrons que le processus Texte vers UMLS peut être significativement amélioré grâce à la supervision faible, sans nécessiter aucune donnée annotée par des experts du domaine. Notre analyse montre que l’ensemble du pipeline permet de révéler des cas de maladies rares, la plupart du temps non détectés dans les codes ICD manuels associés aux admissions hospitalières.

Identification de maladies rares à partir de notes cliniques à l’aide d’ontologies et de supervision faible | Articles de recherche récents | HyperAI