Génération de texte guidée par modèle pour les dialogues orientés vers une tâche

Les assistants virtuels tels que Google Assistant, Amazon Alexa et Apple Siri permettent aux utilisateurs d’interagir avec un grand nombre de services et d’API web en utilisant un langage naturel. Dans ce travail, nous étudions deux méthodes de génération de langage naturel (NLG) basées sur un seul modèle indépendant du domaine, appliqué à un large éventail d’API. Premièrement, nous proposons une approche guidée par le schéma, qui conditionne la génération sur un schéma décrivant l’API en langage naturel. Deuxièmement, nous explorons l’utilisation d’un petit nombre de modèles (templates), dont le nombre croît linéairement en fonction du nombre de champs (slots), afin de transmettre la sémantique de l’API. Pour générer des énoncés correspondant à une combinaison arbitraire de champs, quelques modèles simples sont d’abord concaténés afin d’obtenir un énoncé sémantiquement correct, mais potentiellement incohérent ou non grammatical. Un modèle de langage pré-entraîné est ensuite utilisé pour réécrire cet énoncé afin d’en améliorer la cohérence et le naturel. Grâce à des métriques automatiques et à une évaluation humaine, nous démontrons que notre méthode surpasse des modèles de référence performants, est robuste aux entrées hors domaine et présente une meilleure efficacité en échantillonnage.