Estimation de la qualité neuronale avec plusieurs hypothèses pour la correction des erreurs grammaticales

La correction des erreurs grammaticales (GEC) vise à corriger les erreurs d'écriture et à aider les apprenants de langues à améliorer leurs compétences rédactionnelles. Cependant, les modèles de GEC existants ont tendance à produire des corrections erronées ou à ne pas détecter de nombreuses erreurs. Un modèle d'estimation de la qualité est nécessaire pour garantir que les apprenants reçoivent des résultats de GEC précis et évitent d'être induits en erreur par des phrases mal corrigées. Les modèles de GEC bien entraînés peuvent générer plusieurs hypothèses de haute qualité grâce au décodage, comme la recherche en faisceau (beam search), qui fournissent des preuves précieuses pour la correction des erreurs grammaticales et peuvent être utilisées pour évaluer la qualité du GEC. Cependant, les modèles existants négligent les preuves potentielles du GEC provenant d'hypothèses différentes. Cet article présente le réseau neuronal de vérification (Neural Verification Network, VERNet) pour l'estimation de la qualité du GEC avec plusieurs hypothèses. VERNet établit des interactions entre les hypothèses à travers un graphe de raisonnement et met en œuvre deux types de mécanismes d'attention pour propager les preuves du GEC afin de vérifier la qualité des hypothèses générées. Nos expériences sur quatre jeux de données GEC montrent que VERNet atteint des performances de détection d'erreurs grammaticales parmi les meilleures actuellement disponibles, obtient les meilleurs résultats en estimation de la qualité et améliore significativement les performances du GEC en réordonnant les hypothèses. Toutes les données et les codes sources sont disponibles sur https://github.com/thunlp/VERNet.