Frage-Antwort-Datensatz V1.2
Datum
Größe
Veröffentlichungs-URL
Kategorien
Question Answer Dataset ist ein Frage-Antwort-Datensatz, der Links zu einem Korpus von Wikipedia-Artikeln kombiniert und manuell simulierte Fragen und Antworten für die akademische Forschung generiert. Der Datensatz ist in drei Teile unterteilt: Artikel, Fragen und Antworten. Die manuell generierten simulierten Fragen und Antworten lassen sich bei Wikipedia-Artikeln nur sehr schwer bewerten.
Der Question Answer Dataset wurde 2013 von der Carnegie Mellon University veröffentlicht. Die Hauptherausgeber waren Noah Smith, Michael Heilman, Rebecca Hwa, Shay Cohen und Kevin Gimpel. Die früheste Version der Daten wurde hauptsächlich von Studenten der Carnegie Mellon University und der University of Pittsburgh zwischen 2008 und 2010 erhoben.