Réseau de neurones convolutif basé sur l'attention pour l'extraction de relations sémantiques

Actuellement, les réseaux de neurones jouent un rôle crucial dans la classification des relations. Dans cet article, nous proposons une nouvelle architecture basée sur l'attention et les réseaux de neurones convolutionnels pour cette tâche. Notre modèle exploite pleinement les informations provenant des embeddings de mots, des embeddings de tags morpho-syntaxiques (part-of-speech) et des embeddings de position. Le mécanisme d'attention au niveau des mots permet de déterminer de manière plus efficace quelles parties de la phrase exercent la plus forte influence par rapport aux deux entités d'intérêt. Cette architecture permet d'apprendre des caractéristiques importantes à partir de données étiquetées spécifiques à la tâche, sans nécessiter de connaissances externes telles que des structures de dépendance explicites. Des expériences menées sur le jeu de données de référence SemEval-2010 Task 8 montrent que notre modèle obtient de meilleures performances que plusieurs modèles neuronaux de pointe, tout en atteignant un résultat compétitif avec une ingénierie de caractéristiques minimale.