HyperAIHyperAI
il y a 11 jours

Correction d'erreurs grammaticales dans des scénarios à faibles ressources

Jakub Náplava, Milan Straka
Correction d'erreurs grammaticales dans des scénarios à faibles ressources
Résumé

La correction des erreurs grammaticales en anglais est un problème largement étudié, avec de nombreux systèmes et jeux de données existants. Toutefois, les recherches sur la correction des erreurs grammaticales dans d'autres langues restent limitées. Dans cet article, nous présentons un nouveau jeu de données, AKCES-GEC, dédié à la correction des erreurs grammaticales en tchèque. Nous menons ensuite des expérimentations sur le tchèque, l'allemand et le russe, et montrons que l'utilisation d'un corpus parallèle synthétique permet au modèle de traduction automatique neuronal Transformer d'atteindre de nouveaux résultats d'état de l'art sur ces jeux de données. AKCES-GEC est publié sous licence CC BY-NC-SA 4.0 à l'adresse https://hdl.handle.net/11234/1-3057, et le code source du modèle de correction grammaticale est disponible à l'adresse https://github.com/ufal/low-resource-gec-wnut2019.

Correction d'erreurs grammaticales dans des scénarios à faibles ressources | Articles de recherche récents | HyperAI