PullNet: Offene Domänen-Fragebeantwortung mit iterativer Retrieval auf Wissensbasen und Text

Wir betrachten die offene Fragebeantwortung (QA), bei der Antworten aus einem Korpus, einer Wissensbasis (KB) oder einer Kombination beider abgeleitet werden. Unser Fokus liegt auf einem Szenario, in dem ein Korpus durch eine große, aber unvollständige KB ergänzt wird, und auf Fragen, die nicht-triviale (z.B. „mehrstufige“) Schlussfolgerungen erfordern. Wir beschreiben PullNet, einen integrierten Framework für (1) das Lernen, was abgerufen werden soll (aus der KB und/oder dem Korpus) und (2) das Schließen mit dieser heterogenen Information, um die beste Antwort zu finden. PullNet verwendet einen iterativen Prozess, um einen fragebezogenen Subgraphen zu konstruieren, der Informationen enthält, die für die Frage relevant sind. In jeder Iteration wird ein Graph Convolutional Network (Graph-CNN) verwendet, um Subgraph-Knoten zu identifizieren, die mittels Abruf- (oder „Pull“-) Operationen im Korpus und/oder in der KB erweitert werden sollten. Nachdem der Subgraph vollständig ist, wird ein ähnliches Graph-CNN verwendet, um die Antwort aus dem Subgraphen zu extrahieren. Dieser Abruf-und-Schlussfolgerungsprozess ermöglicht es uns, mehrstufige Fragen unter Verwendung großer KBs und Korpora zu beantworten. PullNet ist schwach überwacht und benötigt lediglich Frage-Antwort-Paare, aber keine goldenen Inferenzpfade. Experimentell zeigt PullNet eine Verbesserung gegenüber den bisherigen Stand der Technik; insbesondere in Szenarien, in denen ein Korpus zusammen mit einer unvollständigen KB verwendet wird, sind diese Verbesserungen oft dramatisch. Auch in rein KB-basierten oder rein textbasierten Szenarien übertrifft PullNet häufig vorherige Systeme.