QAngaroo-Datensatz Zum Mehrstufigen Schlussfolgerungslesen
Datum
Größe
Veröffentlichungs-URL
Kategorien
Der QAngaroo-Datensatz ist ein 2018 vom University College London (UCL) erstellter Leseverständnis-Datensatz, der sich auf Multi-Hop-Reasoning konzentriert.Erstellen von Datensätzen für das Multi-Hop-Leseverständnis über Dokumente hinweg". Dieser Datensatz besteht aus zwei Teilen: WikiHop und MedHop, deren Ziel es ist, eine Leseverständnismethode zu entwickeln, die Multi-Hop-Schlussfolgerungen durchführen kann, d. h., in verschiedenen Dokumenten verstreute Fakten erfordern mehrere Schlussfolgerungsschritte, um neue Fakten abzuleiten.
WikiHop ist ein Open-Domain-Datensatz mit Schwerpunkt auf Wikipedia-Artikeln, der 43.738 Beispiele im Trainingssatz und 5.129 Beispiele im Validierungssatz enthält.

MedHop ist ein Datensatz, der auf PubMed-Paper-Abstracts basiert und 1.620 Proben im Trainingssatz und 342 Proben im Validierungssatz enthält.

Jedes Beispiel enthält eine Abfrage, unterstützende Fakten, mögliche Antworten, die richtige Antwort und eine eindeutige Kennung. Diese Datensätze bieten Forschern Trainings- und Bewertungsressourcen für die Entwicklung von Leseverständnismodellen, die komplexe Denkaufgaben bewältigen können.