HyperAIHyperAI
il y a 12 jours

TNT-NLG, Système 1 : Utilisation d'une NLG statistique pour amplifier massivement les données collectées par le crowd-sourcing afin de générer des modèles neuronaux

{Marilyn A. Walker, Stephanie Lukin, Shubhangi Tandon, Shereen Oraby, Lena Reed}
Résumé

Depuis l’application réussie de l’apprentissage séquence-à-séquence aux systèmes de traduction automatique par réseaux neuronaux (Sutskever et al., 2014), l’intérêt s’est considérablement accru quant à son applicabilité dans le domaine de la génération de langage naturel dans d’autres contextes problématiques. Dans le domaine de la génération de langage naturel (NLG), un grand intérêt s’est porté sur les modèles neuronaux end-to-end (E2E) capables d’apprendre et de générer des énoncés linguistiques naturels en une seule étape. Dans cet article, nous présentons le système TNT-NLG 1, notre première soumission au défi E2E NLG, dans lequel nous générons des réalisations en langage naturel (LN) à partir de représentations de sens (MR) dans le domaine des restaurants, en élargissant massivement le jeu de données d’entraînement. Nous avons développé deux modèles pour ce système, s’inspirant du modèle de base open source de Dusek et al. (2016a) ainsi que du générateur de langage neuronal sensible au contexte. À partir des paires représentation de sens (MR) / langage naturel (LN) issues du jeu de données du défi E2E, nous avons considérablement augmenté la taille de l’ensemble d’entraînement à l’aide de PERSONAGE (Mairesse et Walker, 2010), un générateur statistique capable de produire des réalisations variées à partir de MR, et avons utilisé ces données élargies comme entrée contextuelle pour nos modèles. Nous présentons les résultats d’évaluation obtenus à l’aide de métriques automatisées et d’évaluations humaines, ainsi que des perspectives pour des travaux futurs.

TNT-NLG, Système 1 : Utilisation d'une NLG statistique pour amplifier massivement les données collectées par le crowd-sourcing afin de générer des modèles neuronaux | Articles de recherche récents | HyperAI