HyperAIHyperAI
il y a 2 mois

Amélioration de la compréhension des documents cliniques dans la recherche sur le COVID-19 avec Spark NLP

Veysel Kocaman; David Talby
Amélioration de la compréhension des documents cliniques dans la recherche sur le COVID-19 avec Spark NLP
Résumé

Suite à la pandémie mondiale de COVID-19, le nombre d'articles scientifiques étudiant le virus a considérablement augmenté, suscitant un intérêt accru pour les revues littéraires automatisées. Nous présentons un système de fouille de textes cliniques qui améliore les efforts précédents de trois manières. Premièrement, il est capable de reconnaître plus de 100 types d'entités différents, y compris les déterminants sociaux de la santé, l'anatomie, les facteurs de risque et les événements indésirables, en plus des entités cliniques et biomédicales couramment utilisées. Deuxièmement, le pipeline de traitement du texte inclut une détection du statut d'affirmation, permettant de distinguer entre les faits cliniques présents, absents, conditionnels ou concernant une personne autre que le patient. Troisièmement, les modèles d'apprentissage profond utilisés sont plus précis que ceux précédemment disponibles, en tirant parti d'un pipeline intégré de modèles préformés avancés pour la reconnaissance des entités nommées et en améliorant les meilleures performances antérieures pour la détection du statut d'affirmation.Nous illustrons l'extraction des tendances et des insights à partir du COVID-19 Open Research Dataset (CORD-19), par exemple les troubles et symptômes les plus fréquents ainsi que les signes vitaux et résultats d'ECG les plus courants. Le système est construit en utilisant la bibliothèque Spark NLP qui prend en charge nativement l'évolutivité pour utiliser des clusters distribués, en exploitant des GPU, des pipelines NLP configurables et réutilisables, des plongements spécifiques aux soins de santé et la capacité d'entraîner des modèles pour supporter de nouveaux types d'entités ou des langues humaines sans modification du code.

Amélioration de la compréhension des documents cliniques dans la recherche sur le COVID-19 avec Spark NLP | Articles de recherche récents | HyperAI