HyperAI초신경

QAngaroo 다단계 추론 독해 데이터 세트

날짜

8달 전

크기

324.1 MB

기관

QAngaroo 데이터 세트는 2018년 런던대학교(UCL)에서 만든 독해 이해 데이터 세트로, 멀티홉 추론에 초점을 맞춥니다.문서 간 멀티홉 독해를 위한 데이터 세트 구성". 이 데이터 세트는 WikiHop과 MedHop의 두 부분으로 구성되어 있으며, MedHop은 다중 홉 추론을 수행할 수 있는 독해 방법을 구축하는 것을 목표로 합니다. 즉, 여러 문서에 분산된 사실들을 여러 단계의 추론 과정을 거쳐 새로운 사실을 도출하는 것입니다.

WikiHop은 Wikipedia 문서에 초점을 맞춘 오픈 도메인 데이터 세트로, 훈련 세트에 43,738개의 샘플과 검증 세트에 5,129개의 샘플을 포함하고 있습니다.

MedHop은 PubMed 논문 초록을 기반으로 하는 데이터 세트로, 훈련 세트에 1,620개 샘플, 검증 세트에 342개 샘플을 포함하고 있습니다.

각 샘플에는 질의, 뒷받침 사실, 후보 답변, 정답 및 고유 식별자가 포함되어 있습니다. 이러한 데이터 세트는 연구자들에게 복잡한 추론 과제를 처리할 수 있는 독해 이해 모델을 개발하기 위한 교육 및 평가 리소스를 제공합니다.

QAngaroo.torrent
시딩 1다운로드 중 0완료됨 77총 다운로드 횟수 103
  • QAngaroo/
    • README.md
      1.72 KB
    • README.txt
      3.45 KB
      • data/
        • qangaroo_v1.1.zip
          324.1 MB