HyperAIHyperAI
vor 2 Monaten

Wikipedia lesen, um offene Fragen zu beantworten

Danqi Chen; Adam Fisch; Jason Weston; Antoine Bordes
Wikipedia lesen, um offene Fragen zu beantworten
Abstract

Dieses Papier schlägt vor, offene Frage-Antwort-Aufgaben (open-domain question answering) mit Wikipedia als einzigem Wissensquellen zu bearbeiten: die Antwort auf jede Faktoidfrage ist ein Textausschnitt in einem Wikipedia-Artikel. Diese Aufgabe des maschinellen Lesens im großen Maßstab kombiniert die Herausforderungen der Dokumentensuche (das Finden relevanter Artikel) mit denen der maschinellen Textverstehens (die Identifizierung von Antwortabschnitten in diesen Artikeln). Unser Ansatz vereint eine Suchkomponente, die auf Bigramm-Hashing und TF-IDF-Matching basiert, mit einem mehrschichtigen rekurrenten neuronalen Netzmodell, das darauf trainiert wurde, Antworten in Wikipedia-Paragraphen zu erkennen. Unsere Experimente mit mehreren existierenden QA-Datensätzen zeigen, dass (1) beide Module im Vergleich zu bestehenden Gegenstücken hochwettbewerbsfähig sind und (2) das Multitask-Lernen unter Verwendung von distanter Überwachung auf ihrer Kombination ein effektives vollständiges System für diese anspruchsvolle Aufgabe darstellt.