HyperAI초신경

HotpotQA 질문 답변 데이터 세트

날짜

3년 전

크기

673.69 MB

기관

발행 주소

hotpotqa.github.io

라이선스

CC BY-SA 4.0

特色图像

HotpotQA 데이터 세트는 영어 위키백과에서 수집된 대규모 질의응답 데이터 세트로, 113,000개의 크라우드소싱 질문이 포함되어 있습니다. 이러한 질문에 답하려면 위키피디아 문서 두 개의 소개 부분을 참조해야 합니다. 각 질문은 두 개의 골드 문단과 질문에 답하는 데 필요하다고 여겨지는 뒷받침 사실을 제공하는 문단의 일부에서 발췌한 문장 목록으로 구성되어 있습니다.

데이터 세트는 다음과 같은 특징을 가지고 있습니다.

  1. 질문에 답하려면 여러 가지 뒷받침 자료를 찾아보고 추론해야 합니다.
  2. 문제는 다양하며 기존의 지식 기반이나 지식 체계에 의해 제한되지 않습니다.
  3. 이 데이터 세트는 추론에 필요한 문장 수준의 뒷받침 사실을 제공하여 QA 시스템이 강력한 감독 하에 추론하고 예측을 설명할 수 있도록 합니다.
  4. 이 데이터 세트는 QA 시스템이 관련 사실을 추출하고 필요한 비교를 수행하는 능력을 테스트하기 위한 새로운 유형의 사실 비교 문제를 제공합니다.
HotpotQA.torrent
시딩 1다운로드 중 1완료됨 409총 다운로드 횟수 792
  • HotpotQA/
    • README.md
      1.47 KB
    • README.txt
      2.95 KB
      • data/
        • hotpot_dev_distractor_v1.json
          44.18 MB
        • hotpot_dev_fullwiki_v1.json
          89.43 MB
        • hotpot_test_fullwiki_v1.json
          133.51 MB
        • hotpot_train_v1.1.json
          673.69 MB