HyperAIHyperAI
vor 17 Tagen

HopRetriever: Hops über Wikipedia abrufen, um komplexe Fragen zu beantworten

Shaobo Li, Xiaoguang Li, Lifeng Shang, Xin Jiang, Qun Liu, Chengjie Sun, Zhenzhou Ji, Bingquan Liu
HopRetriever: Hops über Wikipedia abrufen, um komplexe Fragen zu beantworten
Abstract

Die Gewinnung unterstützender Beweise aus großen Textkorpora (z. B. Wikipedia) stellt eine erhebliche Herausforderung für offene Domänen-Fragebeantwortungssysteme (open-domain Question Answering, QA) dar. Insbesondere bei multi-hop offenen Domänen-QA müssen verstreute Beweisteile zusammengetragen werden, um die Antwortextraktion zu ermöglichen. In diesem Paper stellen wir ein neues Retrieval-Ziel, das sogenannte „Hop“, vor, um versteckte Schlussfolgerungsbeweise aus Wikipedia für komplexe Fragebeantwortung zu erfassen. Konkret wird ein „Hop“ in diesem Kontext als Kombination aus einem Hyperlink und dem entsprechenden Ausgangsdokument dieses Links definiert. Der Hyperlink wird als Mention-Embedding kodiert, das die strukturierte Wissenslage modelliert, wie die Zielentität im textuellen Kontext erwähnt wird, während das zugehörige Ausgangsdokument als Dokument-Embedding repräsentiert wird, das die unstrukturierten Kenntnisse innerhalb des Dokuments abbildet. Darauf aufbauend entwickeln wir HopRetriever, ein System, das Hops über Wikipedia abruft, um komplexe Fragen zu beantworten. Experimente auf dem HotpotQA-Datensatz zeigen, dass HopRetriever bisher veröffentlichte Methoden zur Beweisretrieval deutlich übertrifft. Zudem ermöglicht unser Ansatz eine quantifizierbare Interpretation des Beweis-Sammelprozesses.