HyperAIHyperAI
vor 17 Tagen

Denoising von entfernt überwachten, offenen Domänen-Fragebeantwortung

{Yankai Lin, Maosong Sun, Zhiyuan Liu, Haozhe Ji}
Denoising von entfernt überwachten, offenen Domänen-Fragebeantwortung
Abstract

Distantly supervised open-domain question answering (DS-QA) zielt darauf ab, Antworten in Sammlungen von ungelabelten Texten zu finden. Bestehende DS-QA-Modelle ziehen in der Regel relevante Abschnitte aus einer großskaligen Korpus und wenden Techniken des Leseverständnisses an, um Antworten aus dem relevantesten Abschnitt zu extrahieren. Dabei werden jedoch die reichhaltigen Informationen in anderen Abschnitten ignoriert. Zudem weist datenbasierte Distanzüberwachung zwangsläufig das Problem falscher Etikettierung auf, und diese verrauschten Daten verschlechtern die Leistungsfähigkeit von DS-QA erheblich. Um diese Probleme anzugehen, schlagen wir ein neues DS-QA-Modell vor, das einen Abschnittsauswähler verwendet, um verrauschte Abschnitte zu filtern, und einen Abschnittsleser, um die korrekte Antwort aus den gereinigten Abschnitten zu extrahieren. Experimentelle Ergebnisse auf realen Datensätzen zeigen, dass unser Modell nützliche Informationen aus verrauschten Daten gewinnen kann und im Vergleich zu allen Baselines erhebliche Verbesserungen bei DS-QA erzielt.