Un Cadre Unifié de Pré-entraînement pour l'IA Conversationnelle

Dans cette étude, nous explorons l'application de PLATO-2 à divers systèmes de dialogue, notamment les conversations à domaine ouvert, les dialogues fondés sur des connaissances et les conversations orientées vers des tâches. PLATO-2 est initialement conçu comme un chatbot à domaine ouvert, formé par apprentissage curriculaire en deux étapes. Dans la première étape, un modèle de génération de réponses grossier est appris pour s'adapter à une relation de correspondance simplifiée un-à-un. Ce modèle est ensuite appliqué aux conversations orientées vers des tâches, étant donné que les mappages sémantiques ont tendance à être déterministes dans l'accomplissement des tâches. Dans la deuxième étape, un autre modèle de génération de réponses plus fin et un modèle d'évaluation sont appris pour générer des réponses variées et évaluer la cohérence, respectivement. Grâce à leur capacité supérieure à capturer des relations de correspondance un-à-plusieurs, ces modèles sont particulièrement adaptés aux conversations à domaine ouvert et aux dialogues fondés sur des connaissances. Pour une évaluation complète de PLATO-2, nous avons participé à plusieurs tâches du DSTC9 (Dialog System Technology Challenges 9), incluant l'évaluation interactive des conversations à domaine ouvert (Track3-tâche2), l'évaluation statique des dialogues fondés sur des connaissances (Track3-tâche1) et la conversation orientée vers des tâches de bout en bout (Track2-tâche1). PLATO-2 a obtenu le premier rang dans chacune de ces trois tâches, confirmant son efficacité en tant que cadre unifié pour divers systèmes de dialogue.