Classification des relations à l'aide de réseaux de neurones à mémoire à court et long terme le long du chemin de dépendance le plus court

La classification des relations est un domaine de recherche important dans le champ du traitement automatique des langues naturelles (TALN). Dans cet article, nous présentons SDP-LSTM, un nouveau réseau neuronal conçu pour classer la relation entre deux entités dans une phrase. Notre architecture neuronale exploite le plus court chemin de dépendance (SDP) entre les deux entités ; des réseaux neuronaux récurrents multicanaux, dotés d'unités de mémoire à court et long terme (LSTM), capturent des informations hétérogènes le long du SDP. Notre modèle proposé présente plusieurs caractéristiques distinctes : (1) Les plus courts chemins de dépendance conservent les informations les plus pertinentes (pour la classification des relations), tout en éliminant les mots non pertinents de la phrase. (2) Les réseaux neuronaux récurrents multicanaux permettent une intégration efficace des informations provenant de sources hétérogènes le long des chemins de dépendance. (3) Une stratégie de dropout personnalisée régularise le réseau neuronal afin d'atténuer le surapprentissage. Nous avons testé notre modèle sur la tâche de classification des relations du SemEval 2010, et nous avons obtenu un score $F_1$ de 83,7\%, supérieur aux méthodes concurrentes décrites dans la littérature.