HyperAIHyperAI
il y a 2 mois

De l’étiquetage morpho-syntactique à l’analyse de dépendance pour l’extraction d’événements biomédicaux

Dat Quoc Nguyen; Karin Verspoor
De l’étiquetage morpho-syntactique à l’analyse de dépendance pour l’extraction d’événements biomédicaux
Résumé

Contexte : Étant donné l'importance de l'extraction de relations ou d'événements à partir des publications de recherche biomédicale pour soutenir la capture et la synthèse des connaissances, ainsi que la forte dépendance des approches à cette tâche d'extraction d'information envers les informations syntaxiques, il est précieux de comprendre quelles approches de traitement syntaxique du texte biomédical présentent les meilleures performances.Résultats : Nous avons mené une étude empirique comparant les modèles traditionnels basés sur des caractéristiques et les modèles basés sur des réseaux neuronaux de pointe pour deux tâches fondamentales du traitement automatique des langues naturelles : l'étiquetage morphosyntaxique (POS tagging) et l'analyse de dépendance, sur deux corpus biomédicaux de référence, GENIA et CRAFT. À notre connaissance, il n'existe pas de travaux récents effectuant de telles comparaisons dans le contexte biomédical ; plus précisément, aucune analyse détaillée des modèles neuronaux sur ces données n'est disponible. Les résultats expérimentaux montrent qu'en général, les modèles neuronaux surpassent les modèles basés sur des caractéristiques sur les deux corpus biomédicaux de référence GENIA et CRAFT. Nous avons également effectué une évaluation orientée vers la tâche pour examiner l'influence de ces modèles dans une application en aval liée à l'extraction d'événements biomédicaux, et nous montrons que de meilleures performances intrinsèques en analyse syntaxique ne signifient pas toujours de meilleures performances extrinsèques en extraction d'événements.Conclusion : Nous avons présenté une étude empirique détaillée comparant les modèles traditionnels basés sur des caractéristiques et les modèles basés sur des réseaux neuronaux pour l'étiquetage morphosyntaxique et l'analyse de dépendance dans le contexte biomédical, ainsi qu'une investigation sur l'influence du choix du parseur pour une tâche en aval d'extraction d'événements biomédicaux.Disponibilité des données et matériaux : Nous mettons à disposition les modèles re-entraînés à l'adresse suivante : https://github.com/datquocnguyen/BioPosDep

De l’étiquetage morpho-syntactique à l’analyse de dépendance pour l’extraction d’événements biomédicaux | Articles de recherche récents | HyperAI