HyperAIHyperAI
il y a 11 jours

Solutions fondées sur l’apprentissage automatique pour les trois étapes de l’extraction d’information clinique : l’état de l’art à l’i2b2 2010

{Svetlana Kiritchenko, Xiaodan Zhu, Joel Martin, Berry de Bruijn, Colin Cherry}
Résumé

Objectif : Alors que le traitement informatisé des textes cliniques se perfectionne, son potentiel en tant que technologie fondatrice pour l’innovation dans les soins aux patients et la recherche clinique devient une réalité. Une étape cruciale de ce processus consiste à soumettre rigoureusement aux tests de référence les méthodes de traitement du langage naturel sur des récits cliniques réalistes. Dans cet article, les auteurs décrivent la conception et les performances de trois applications de pointe en extraction de données textuelles issues du Conseil national de recherches du Canada, évaluées dans le cadre du défi i2b2 2010.Conception : Les trois systèmes réalisent trois étapes clés de l’extraction d’informations cliniques : (1) l’extraction des problèmes médicaux, des tests et des traitements à partir des résumés de sortie et des notes d’évolution ; (2) la classification des affirmations portant sur les problèmes médicaux ; (3) la classification des relations entre les concepts médicaux. Des systèmes d’apprentissage automatique ont mené ces tâches à bien en utilisant des ensembles de caractéristiques à grande dimension, dérivés à la fois du texte lui-même et de sources externes : UMLS, cTAKES et Medline.Mesures : La performance a été évaluée pour chaque sous-tâche à l’aide de scores F micro-moyennés, calculés en comparant les annotations produites par les systèmes aux annotations de référence sur un jeu de test.Résultats : Les systèmes se sont classés parmi les meilleurs parmi tous les systèmes soumis au concours, avec les scores F suivants : extraction de concepts (0,8523, classé premier), détection d’affirmations (0,9362, classé premier), détection de relations (0,7313, classé deuxième).Conclusion : Pour toutes les tâches, nous avons constaté que l’introduction d’un large éventail de caractéristiques était essentielle au succès. Plus important encore, notre choix d’algorithmes d’apprentissage automatique nous a permis d’adopter une grande souplesse dans la conception des caractéristiques, tout en intégrant un grand nombre de ces dernières sans surajustement (overfitting) ni contraintes liées aux ressources informatiques.

Solutions fondées sur l’apprentissage automatique pour les trois étapes de l’extraction d’information clinique : l’état de l’art à l’i2b2 2010 | Articles de recherche récents | HyperAI