HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

TNT-NLG, Système 1 : Utilisation d'une NLG statistique pour amplifier massivement les données collectées par le crowd-sourcing afin de générer des modèles neuronaux

{Marilyn A. Walker Stephanie Lukin Shubhangi Tandon Shereen Oraby Lena Reed}

Résumé

Depuis l’application réussie de l’apprentissage séquence-à-séquence aux systèmes de traduction automatique par réseaux neuronaux (Sutskever et al., 2014), l’intérêt s’est considérablement accru quant à son applicabilité dans le domaine de la génération de langage naturel dans d’autres contextes problématiques. Dans le domaine de la génération de langage naturel (NLG), un grand intérêt s’est porté sur les modèles neuronaux end-to-end (E2E) capables d’apprendre et de générer des énoncés linguistiques naturels en une seule étape. Dans cet article, nous présentons le système TNT-NLG 1, notre première soumission au défi E2E NLG, dans lequel nous générons des réalisations en langage naturel (LN) à partir de représentations de sens (MR) dans le domaine des restaurants, en élargissant massivement le jeu de données d’entraînement. Nous avons développé deux modèles pour ce système, s’inspirant du modèle de base open source de Dusek et al. (2016a) ainsi que du générateur de langage neuronal sensible au contexte. À partir des paires représentation de sens (MR) / langage naturel (LN) issues du jeu de données du défi E2E, nous avons considérablement augmenté la taille de l’ensemble d’entraînement à l’aide de PERSONAGE (Mairesse et Walker, 2010), un générateur statistique capable de produire des réalisations variées à partir de MR, et avons utilisé ces données élargies comme entrée contextuelle pour nos modèles. Nous présentons les résultats d’évaluation obtenus à l’aide de métriques automatisées et d’évaluations humaines, ainsi que des perspectives pour des travaux futurs.

Benchmarks

BenchmarkMéthodologieMétriques
data-to-text-generation-on-e2e-nlg-challengeSys1-Primary
BLEU: 65.61
CIDEr: 2.2183
METEOR: 45.17
NIST: 8.5105
ROUGE-L: 68.39

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
TNT-NLG, Système 1 : Utilisation d'une NLG statistique pour amplifier massivement les données collectées par le crowd-sourcing afin de générer des modèles neuronaux | Articles de recherche | HyperAI