HyperAIHyperAI
il y a 2 mois

QA-GNN : Raisonnement avec des modèles de langage et des graphes de connaissances pour le traitement des questions-réponses

Michihiro Yasunaga; Hongyu Ren; Antoine Bosselut; Percy Liang; Jure Leskovec
QA-GNN : Raisonnement avec des modèles de langage et des graphes de connaissances pour le traitement des questions-réponses
Résumé

Le problème de répondre à des questions en utilisant les connaissances issues des modèles de langage pré-entraînés (LM) et des graphes de connaissances (KG) présente deux défis : étant donné un contexte QA (question et choix de réponse), les méthodes doivent (i) identifier les connaissances pertinentes dans de grands KG, et (ii) effectuer une inférence conjointe sur le contexte QA et le KG. Dans cette étude, nous proposons un nouveau modèle, QA-GNN, qui aborde ces défis grâce à deux innovations clés : (i) l'évaluation de la pertinence, où nous utilisons les LM pour estimer l'importance des nœuds du KG par rapport au contexte QA donné, et (ii) l'inférence conjointe, où nous connectons le contexte QA et le KG pour former un graphe conjoint, et mettons à jour mutuellement leurs représentations via des réseaux neuronaux graphiques. Nous évaluons notre modèle sur des benchmarks QA dans les domaines du sens commun (CommonsenseQA, OpenBookQA) et biomédical (MedQA-USMLE). Le QA-GNN surpasses les modèles LM existants et LM+KG, et montre une capacité à effectuer une inférence interprétable et structurée, par exemple en traitant correctement la négation dans les questions.

QA-GNN : Raisonnement avec des modèles de langage et des graphes de connaissances pour le traitement des questions-réponses | Articles de recherche récents | HyperAI