CorefQA : Résolution de coréférence comme prédiction d'intervalles basée sur des requêtes

Dans cet article, nous présentons CorefQA, une approche précise et extensible pour la tâche de résolution de coréférence. Nous formulons ce problème comme une tâche de prédiction d’intervalles, de manière similaire à celle des systèmes de réponse à des questions : pour chaque mention candidate, une requête est générée à partir de son contexte environnant, puis un module de prédiction d’intervalles est utilisé pour extraire les segments textuels correspondant aux coréférences au sein du document, à l’aide de la requête générée. Cette formulation présente les avantages clés suivants : (1) la stratégie de prédiction d’intervalles offre une flexibilité permettant de récupérer des mentions négligées lors de l’étape de proposition de mentions ; (2) dans le cadre des systèmes de réponse aux questions, le fait d’encoder explicitement la mention et son contexte dans une requête permet une analyse approfondie et détaillée des indices présents dans le contexte des mentions coréférentes ; et (3) une grande variété de jeux de données existants dédiés à la réponse aux questions peut être exploitée pour une augmentation des données, améliorant ainsi la capacité de généralisation du modèle. Les expériences montrent une amélioration significative par rapport aux modèles antérieurs, avec un score F1 de 83,1 (+3,5) sur la benchmark CoNLL-2012 et de 87,5 (+2,5) sur la benchmark GAP.