Extraction de paires d'arguments par encodage multi-couche multi-croisement guidé par l'attention

L’extraction de paires d’arguments (APE) est une tâche de recherche visant à extraire des arguments à partir de deux passages et à identifier des paires d’arguments potentielles. Les travaux antérieurs traitent cette tâche comme un problème d’étiquetage de séquences et un problème de classification binaire appliqué à deux passages concaténés directement, ce qui présente une limitation : l’utilisation insuffisante des caractéristiques propres et des relations intrinsèques entre deux passages distincts. Ce papier propose un nouveau schéma d’encodage multi-couches à croisements multiples guidé par l’attention pour relever ces défis. Le modèle novateur traite les deux passages à l’aide de deux encodeurs de séquences indépendants et met à jour leurs représentations en s’appuyant mutuellement via une mécanique d’attention. En outre, la phase de prédiction des paires est formulée comme un problème de remplissage de tableau, en mettant à jour les représentations du produit cartésien des deux séquences. Par ailleurs, une perte d’attention auxiliaire est introduite afin de guider chaque argument à s’aligner sur son argument correspondant. Des expériences étendues montrent que le nouveau modèle améliore significativement les performances de l’APE par rapport à plusieurs approches alternatives.