HyperAIHyperAI
il y a 17 jours

Réponse à des questions dans un dialogue sur des sources hétérogènes

Philipp Christmann, Rishiraj Saha Roy, Gerhard Weikum
Réponse à des questions dans un dialogue sur des sources hétérogènes
Résumé

La réponse conversationnelle (ConvQA) s’attaque aux besoins d’information séquentiels, où les contextes des questions suivantes sont implicites. Les systèmes actuels de ConvQA fonctionnent sur des sources d’information homogènes : soit une base de connaissances (KB), soit un corpus textuel, soit une collection de tableaux. Ce papier aborde une problématique nouvelle : exploiter conjointement ces trois types de sources, afin d’améliorer à la fois la couverture des réponses et la confiance dans celles-ci. Nous proposons CONVINSE, un pipeline end-to-end pour la ConvQA sur des sources hétérogènes, fonctionnant en trois étapes : i) apprentissage d’une représentation structurée explicite de la question entrante et de son contexte conversationnel, ii) utilisation de cette représentation de type cadre pour capturer de manière uniforme les éléments de preuve pertinents issus de la KB, du texte et des tableaux, et iii) exécution d’un modèle de fusion dans le décodeur pour générer la réponse. Nous avons construit et publié la première référence (benchmark), ConvMix, pour la ConvQA sur des sources hétérogènes, comprenant 3 000 conversations réelles d’utilisateurs avec 16 000 questions, accompagnées d’annotations d’entités, d’énoncés de questions complétés et de paraphrases de questions. Les expériences démontrent la faisabilité et les avantages de notre méthode par rapport aux états de l’art.

Réponse à des questions dans un dialogue sur des sources hétérogènes | Articles de recherche récents | HyperAI