Extraction d'interactions médicamenteuses via des RNN hiérarchiques sur les séquences et les chemins de dépendance les plus courts
MotivationLes événements indésirables résultant des interactions médicamenteuses (DDI, drug-drug interactions) constituent un enjeu majeur pour la santé publique. La capacité à extraire automatiquement les DDI décrites dans la littérature biomédicale pourrait renforcer les efforts en cours de pharmacovigilance. La plupart des méthodes basées sur les réseaux de neurones se concentrent traditionnellement sur la séquence de phrases pour identifier ces DDI, tout en négligeant le fait que le plus court chemin de dépendance (SDP, shortest dependency path) entre les deux entités contient des informations syntaxiques et sémantiques précieuses. L’exploitation efficace de ces informations pourrait améliorer significativement la performance de l’extraction des DDI.RésultatsDans cet article, nous proposons une méthode fondée sur des réseaux de neurones récurrents hiérarchiques (RNN) pour intégrer à la fois le SDP et la séquence de phrases dans la tâche d’extraction des DDI. Initialement, la séquence de phrases est divisée en trois sous-séquences. Ensuite, un modèle RNN de bas niveau est utilisé pour apprendre les représentations de caractéristiques des sous-séquences et du SDP, tandis qu’un modèle RNN de haut niveau est employé pour apprendre les représentations de caractéristiques de la séquence de phrases et du SDP combinés. Par ailleurs, nous introduisons un mécanisme d’attention sur les embeddings afin d’identifier et de renforcer les mots-clés pertinents pour la tâche d’extraction des DDI. Notre approche a été évaluée sur le corpus DDI Extraction 2013. Les résultats montrent que notre méthode est compétitive ou supérieure aux autres méthodes de pointe. Les expérimentations démontrent que la séquence de phrases et le SDP sont complémentaires. L’intégration de ces deux sources d’information permet effectivement d’améliorer la performance de l’extraction des DDI.