bAbi-Fragen-Antwort- Und Textverständnis-Datensatz
Datum
Veröffentlichungs-URL
Kategorien
* Dieser Datensatz ist online verfügbar.Klicken Sie hier, um zu springen.
Bei den QA bAbI-Aufgaben handelt es sich um Trainingsdatensätze zur Fragebeantwortung und zum Textverständnis im bAbI-Projekt. Sie dienen der Überprüfung des ersten Satzes von 20 Aufgaben zum Textverständnis und folgerichtigen Denken. Jede Aufgabe umfasst 1.000 Fragen zum Training und 1.000 Fragen zum Testen.
Der Datensatz besteht aus einer Reihe von Kontexten, auf deren Grundlage mehrere Frage-Antwort-Paare verwendet werden können. Derzeit gibt es mehrere Verzeichnisse:
- en / – Englische Aufgaben, für Menschen lesbar;
- hn/ – Hindi-Aufgabe, für Menschen lesbar;
- Shuffle/ – Führen Sie die gleiche Aufgabe mit zufälligen Buchstaben aus, die für Menschen nicht lesbar sind und von vorhandenen Parsern und Taggern nicht direkt verwendet werden können, wodurch der Lernende stärker von den gegebenen Trainingsdaten abhängig wird.
- Dieselbe Aufgabe in drei Formaten: en-10k/, shuffled – 10k/ und hn – 10k/, mit 10.000 Trainingsbeispielen.
Der QA bAbI-Aufgabendatensatz wurde 2015 von Jason Weston von Google, Antoine Bordes von Facebook und anderen veröffentlicht. Das zugehörige Dokument trägt den Titel „Towards AI-Complete Question Answering: A Set of Prerequisite Toy Tasks“.