HyperAIHyperAI
il y a 2 mois

Intégration d'embeddings conjoints dans les dialogues orientés vers un objectif avec l'apprentissage multi-tâches

Firas Kassawat; Debanjan Chaudhuri; Jens Lehmann
Intégration d'embeddings conjoints dans les dialogues orientés vers un objectif avec l'apprentissage multi-tâches
Résumé

Les modèles de réseaux neuronaux à encodeur-décodeur basés sur l'attention ont récemment montré des résultats prometteurs dans les systèmes de dialogue orientés vers un objectif. Cependant, ces modèles peinent à raisonner et à intégrer des connaissances avec état tout en conservant leur fonctionnalité de génération de texte de bout en bout. Étant donné que ces modèles peuvent grandement bénéficier de l'intégration des intentions de l'utilisateur et des graphes de connaissances, dans cet article, nous proposons une architecture d'encodeur-décodeur de bout en bout basée sur les RNN (réseaux de neurones récurrents), qui est entraînée avec des plongements conjoints du graphe de connaissances et du corpus comme entrée. Le modèle offre une intégration supplémentaire des intentions de l'utilisateur en plus de la génération de texte, formé selon un paradigme d'apprentissage multitâche accompagné d'une technique régularisatrice supplémentaire pour pénaliser la génération d'entités incorrectes en sortie. Le modèle intègre également une recherche d'entités du graphe de connaissances lors de l'inférence pour garantir que la sortie générée est avec état, basée sur le graphe de connaissances local fourni. Nous avons finalement évalué le modèle en utilisant le score BLEU, et l'évaluation empirique montre que notre architecture proposée peut améliorer les performances des systèmes de dialogue orientés vers une tâche.

Intégration d'embeddings conjoints dans les dialogues orientés vers un objectif avec l'apprentissage multi-tâches | Articles de recherche récents | HyperAI