Un noyau de graphe basé sur des vecteurs de contexte pour l'extraction d'interactions médicamenteuses
La reconnaissance clinique des interactions médicamenteuses (DDI, Drug–Drug Interactions) constitue une question cruciale tant pour la sécurité des patients que pour la maîtrise des coûts de santé. Il existe donc un besoin urgent d’extraire automatiquement les DDI à partir de la littérature biomédicale à l’aide de techniques d’extraction de texte. Bien que les systèmes de pointe en matière de DDI explorent diverses caractéristiques textuelles, celles-ci ne parviennent pas encore à exprimer adéquatement les phrases longues et complexes. Dans cet article, nous proposons un noyau de graphe efficace qui exploite pleinement différents types de contextes pour identifier les DDI dans la littérature biomédicale. Dans notre approche, les relations entre les mots à longue portée, ainsi que ceux à courte portée, sont capturées grâce à une représentation graphique d’une phrase analysée syntaxiquement. Les vecteurs de contexte associés à un sommet — une représentation vectorielle itérative de tous les nœuds étiquetés adjacents et non adjacents à ce sommet — permettent de capturer de manière adéquate les informations provenant à la fois des sous-structures directes et indirectes. En outre, le noyau de graphe, qui prend en compte la distance entre les vecteurs de contexte, est utilisé pour détecter les DDI. Les résultats expérimentaux sur le corpus DDIExtraction 2013 montrent que notre système atteint les meilleurs performances en détection et classification des DDI (F-score respectivement de 81,8 et 68,4). En particulier, sur le jeu de données Medline-2013, notre système surpasse les systèmes de pointe en matière de DDI avec des gains de F-score de 10,7 en détection et de 12,2 en classification.