HyperAI

TriviaQA Ein Großer Datensatz Zum Leseverständnis Und Zur Beantwortung Von Fragen

Datum

vor einem Jahr

Größe

3.07 GB

Organisation

Allen Institute for Artificial Intelligence

Veröffentlichungs-URL

nlp.cs.washington.edu

TriviaQA ist ein Leseverständnis-Datensatz mit mehr als 650.000 Frage-Antwort-Beweistripel. TriviaQA umfasst 950.000 Frage-Antwort-Paare aus 662.000 Dokumenten aus Wikipedia und dem Internet. Dieser Datensatz ist anspruchsvoller als Standard-QA-Benchmarks wie der Stanford Question Answering Dataset (SQuAD), da die Antwort auf die Frage möglicherweise nicht direkt durch Spannvorhersage erhalten wird und der Kontext lang ist. Der TriviaQA-Datensatz besteht sowohl aus von Menschen überprüften als auch aus maschinengenerierten QA-Teilmengen. Weitere Einzelheiten finden Sie im ACL 17-Dokument „TriviaQA: Ein groß angelegter Datensatz für Fernüberwachungs-Challenges zum Leseverständnis"

TriviaQA.torrent
Seeding 1Herunterladen 1Abgeschlossen 80Gesamtdownloads 163
  • TriviaQA/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • TQA.zip
          3.07 GB