HyperAI

Ensemble De Données De Réponses Aux Questions HotpotQA

Date

il y a 3 ans

Taille

673.69 MB

Organisation

URL de publication

hotpotqa.github.io

Licence

CC BY-SA 4.0

特色图像

L'ensemble de données HotpotQA est un ensemble de données de questions-réponses à grande échelle collectées sur Wikipédia en anglais, comprenant 113 000 questions participatives. Pour répondre à ces questions, vous devez vous référer aux paragraphes d’introduction de deux articles de Wikipédia. Chaque question se compose de deux paragraphes d'or et de listes de phrases tirées de parties des paragraphes qui fournissent des faits à l'appui jugés nécessaires pour répondre à la question.

L'ensemble de données présente les caractéristiques suivantes :

  1. Les questions nécessitent de rechercher et de raisonner dans plusieurs documents justificatifs pour y répondre ;
  2. Les problèmes sont divers et ne sont limités par aucune base de connaissances ou schéma de connaissances préexistant ;
  3. L'ensemble de données fournit des faits justificatifs au niveau des phrases nécessaires au raisonnement, permettant aux systèmes d'assurance qualité de raisonner et d'expliquer les prédictions sous une supervision stricte ;
  4. Cet ensemble de données fournit un nouveau type de problème de comparaison de faits pour tester la capacité des systèmes d'assurance qualité à extraire les faits pertinents et à effectuer les comparaisons nécessaires.
HotpotQA.torrent
Partage 2Téléchargement 1Terminés 447Téléchargements totaux 823
  • HotpotQA/
    • README.md
      1.47 KB
    • README.txt
      2.95 KB
      • data/
        • hotpot_dev_distractor_v1.json
          44.18 MB
        • hotpot_dev_fullwiki_v1.json
          89.43 MB
        • hotpot_test_fullwiki_v1.json
          133.51 MB
        • hotpot_train_v1.1.json
          673.69 MB