Piliers de la Correction Grammaticale : Inspection Complète des Approches Contemporaines à l’Ère des Grandes Modèles Linguistiques

Dans cet article, nous menons une recherche expérimentale sur la correction grammaticale (Grammatical Error Correction, GEC), en explorant les subtilités des systèmes basés sur un seul modèle, en comparant l'efficacité des méthodes d'ensemblage et de classement, ainsi qu'en étudiant l'application des grands modèles linguistiques (large language models) à la GEC, tant sous la forme de systèmes uniques que comme composants d'ensembles ou comme méthodes de classement. Nous établissons de nouvelles performances de pointe, atteignant des scores F_0.5 de 72,8 sur le test CoNLL-2014 et de 81,4 sur le test BEA, respectivement. Afin de favoriser les progrès futurs dans le domaine de la GEC et de garantir la reproductibilité de nos résultats, nous mettons publiquement à disposition notre code source, nos modèles entraînés ainsi que les sorties de nos systèmes.