HyperAI초신경

DuReader 대규모 오픈 도메인 중국어 기계 독해 데이터 세트

날짜

3년 전

크기

4.11 GB

기관

바이두

발행 주소

ai.baidu.com

라이선스

其他

카테고리

特色图像

DuReader는 기계 독해 이해 모델과 시스템을 훈련하거나 평가하는 데 사용할 수 있는 기계 독해 이해를 위한 대규모 오픈 도메인 중국어 데이터 세트입니다.

이 데이터 세트는 20만 개의 질문, 42만 개의 답변, 100만 개의 문서로 구성되어 있습니다. 질문과 문서는 Baidu Search와 Baidu Knows를 기반으로 하며, 답변은 수동으로 생성됩니다. 이 데이터 세트는 또한 질문 유형에 대한 주석을 제공하며, 각 질문에는 엔터티, 설명, 예/아니오, 사실 또는 의견과 같은 범주가 수동으로 레이블됩니다.

DuReader.torrent
시딩 1다운로드 중 1완료됨 324총 다운로드 횟수 608
  • DuReader/
    • README.md
      1.21 KB
    • README.txt
      2.41 KB
      • data/
        • dureader_preprocessed.zip
          2.79 GB
        • dureader_raw.zip
          4.11 GB