HyperAI

HotpotQA-Frage-Antwort-Datensatz

Datum

vor 3 Jahren

Größe

673.69 MB

Organisation

Veröffentlichungs-URL

hotpotqa.github.io

Lizenz

CC BY-SA 4.0

特色图像

Der HotpotQA-Datensatz ist ein umfangreicher Frage-Antwort-Datensatz, der auf der englischen Wikipedia gesammelt wurde und 113.000 Crowdsourcing-Fragen umfasst. Um diese Fragen zu beantworten, müssen Sie die Einführungsabsätze zweier Wikipedia-Artikel zu Rate ziehen. Jede Frage besteht aus zwei goldenen Absätzen und Listen mit Sätzen aus Teilen der Absätze, die unterstützende Fakten liefern, die zur Beantwortung der Frage als notwendig erachtet werden.

Der Datensatz weist die folgenden Eigenschaften auf:

  1. Zur Beantwortung der Fragen müssen mehrere unterstützende Dokumente nachgeschlagen und begründet werden.
  2. Die Probleme sind vielfältig und nicht durch eine bereits vorhandene Wissensbasis oder ein Wissensschema eingeschränkt.
  3. Der Datensatz stellt die für die Schlussfolgerung erforderlichen unterstützenden Fakten auf Satzebene bereit, sodass QA-Systeme unter strenger Aufsicht Schlussfolgerungen ziehen und Vorhersagen erklären können.
  4. Dieser Datensatz bietet eine neue Art von Faktenvergleichsproblem, um die Fähigkeit von QA-Systemen zu testen, relevante Fakten zu extrahieren und notwendige Vergleiche durchzuführen.
HotpotQA.torrent
Seeding 1Herunterladen 1Abgeschlossen 409Gesamtdownloads 792
  • HotpotQA/
    • README.md
      1.47 KB
    • README.txt
      2.95 KB
      • data/
        • hotpot_dev_distractor_v1.json
          44.18 MB
        • hotpot_dev_fullwiki_v1.json
          89.43 MB
        • hotpot_test_fullwiki_v1.json
          133.51 MB
        • hotpot_train_v1.1.json
          673.69 MB