Modellierung von Welten im Text

Wir stellen einen Datensatz bereit, der die Entwicklung von Lernagenten ermöglicht, die weltbasierte Wissensgraphen-Modelle interaktiver Erzählungen aufbauen können. Interaktive Erzählungen – auch als Text-Adventure-Spiele bekannt – sind teilweise beobachtbare Umgebungen, die als lange Rätsel oder Quests strukturiert sind, in denen ein Agent die Welt ausschließlich durch natürliche Sprache wahrnimmt und mit ihr interagiert. Jedes einzelne Spiel enthält typischerweise Hunderte von Orten, Charakteren und Objekten – jeweils mit eindeutigen Beschreibungen –, was die Möglichkeit bietet, das Problem zu untersuchen, wie Sprachagenten eine strukturierte Gedächtnisarchitektur erhalten, um in solchen Welten effektiv zu agieren. Unser Datensatz enthält 24.198 Abbildungen zwischen reichhaltigen natürlichen Sprachbeobachtungen und: (1) Wissensgraphen, die den Weltzustand in Form einer Karte widerspiegeln; (2) natürlichen Sprachaktionen, die garantiert eine Änderung des jeweiligen Weltzustands bewirken. Die Trainingsdaten wurden über 27 Spiele in verschiedenen Genres gesammelt und enthalten zusätzlich 7.836 Testinstanzen aus weiteren 9 Spielen. Zusätzlich stellen wir Baseline-Modelle bereit, die auf regelbasierten Ansätzen, Fragenbeantwortung und Sequenzlernverfahren basieren, sowie eine Analyse der Daten und der zugehörigen Lernaufgaben.