HyperAIHyperAI

Command Palette

Search for a command to run...

Aborder la correction grammaticale neuronale comme une tâche de traduction automatique à faibles ressources

Marcin Junczys-Dowmunt; Roman Grundkiewicz; Shubha Guha; Kenneth Heafield

Résumé

Précédemment, les méthodes neuronales dans la correction d'erreurs grammaticales (CER) n'atteignaient pas des résultats de pointe comparés aux lignes de base de la traduction automatique statistique basée sur des phrases (SMT). Nous démontrons des parallèles entre la CER neuronale et la traduction automatique neuronale à faibles ressources et adaptons avec succès plusieurs méthodes de la traduction automatique neuronale à faibles ressources à la CER neuronale. Nous établissons également des directives pour des résultats fiables en CER neuronale et proposons un ensemble de méthodes indépendantes du modèle pour la CER neuronale qui peuvent être facilement appliquées dans la plupart des configurations de CER. Les méthodes proposées incluent l'ajout de bruit côté source, des techniques d'adaptation au domaine, un objectif d'entraînement spécifique à la CER, l'apprentissage par transfert avec des données monolingues, et l'agrégation de modèles de CER entraînés indépendamment et de modèles linguistiques. Les effets combinés de ces méthodes conduisent à des modèles de CER neuronaux supérieurs aux systèmes précédents les plus performants en matière de CER neuronale, surpassant ceux-ci d'au moins 10% M2^22 sur le banc d'essai CoNLL-2014 et de 5,9% sur l'ensemble de tests JFLEG. Les systèmes non neuronaux les plus performants sont dépassés d'au moins 2% sur le banc d'essai CoNLL-2014 et de 4% sur JFLEG.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp