Apprentissage Métrique Neural pour une Extraction Rapide de Relations de bout en bout

L'extraction de relations (RE) est une tâche d'extraction d'information indispensable dans plusieurs disciplines. Les modèles RE supposent généralement que l'identification des entités nommées (NER) a déjà été effectuée à un stade antérieur par un autre modèle indépendant. Plusieurs efforts récents, dans le cadre de l'extraction de relations bout-en-bout, visent à exploiter les corrélations inter-tâches en modélisant conjointement les tâches NER et RE. Dans les travaux antérieurs dans ce domaine, la tâche est souvent réduite à un problème de remplissage de table, où une étape supplémentaire et coûteuse de décodage impliquant une recherche en faisceau est appliquée pour obtenir des étiquettes de cellules globalement cohérentes. Dans les approches qui n'utilisent pas le remplissage de table, une optimisation globale sous forme de CRF avec décodage Viterbi pour la composante NER reste nécessaire pour obtenir des performances compétitives. Nous présentons une nouvelle architecture neuronale utilisant la structure tabulaire, basée sur des applications répétées de convolutions 2D pour agréger des caractéristiques locales de dépendance et métriques, qui améliore l'état de l'art sans nécessiter d'optimisation globale. Nous validons notre modèle sur les jeux de données ADE et CoNLL04 pour l'extraction de relations bout-en-bout et démontrons une amélioration d'environ 1% (en termes de F-mesure) par rapport aux meilleurs résultats précédents, avec des temps d'entraînement et de test sept à dix fois plus rapides — ce qui est particulièrement avantageux pour les applications sensibles au temps destinées aux utilisateurs finaux.