HyperAI초신경

TriviaQA 독해 및 질의응답을 위한 대규모 데이터 세트

날짜

일 년 전

크기

3.07 GB

기관

앨런 인공지능 연구소

카테고리

TriviaQA는 65만 개 이상의 질문-답변 증거 3부작을 포함하는 독해 이해 데이터 세트입니다. TriviaQA에는 Wikipedia와 웹의 662,000개 문서에서 추출한 950,000개의 질문-답변 쌍이 포함되어 있습니다. 이 데이터 세트는 SQuAD(Stanford Question Answering Dataset)와 같은 표준 QA 벤치마크보다 더 어렵습니다. 왜냐하면 질문에 대한 답변이 범위 예측을 통해 직접 얻어지지 않을 수 있고 컨텍스트가 길기 때문입니다. TriviaQA 데이터 세트는 사람이 검증한 QA 하위 집합과 기계가 생성한 QA 하위 집합으로 구성됩니다. 자세한 내용은 ACL 17 문서에서 확인할 수 있습니다.TriviaQA: 독해를 위한 대규모 원격 지도 학습 챌린지 데이터 세트"

TriviaQA.torrent
시딩 1다운로드 중 1완료됨 80총 다운로드 횟수 163
  • TriviaQA/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • TQA.zip
          3.07 GB