DuReader 대규모 오픈 도메인 중국어 기계 독해 데이터 세트

DuReader는 기계 독해 이해 모델과 시스템을 훈련하거나 평가하는 데 사용할 수 있는 기계 독해 이해를 위한 대규모 오픈 도메인 중국어 데이터 세트입니다.
이 데이터 세트는 20만 개의 질문, 42만 개의 답변, 100만 개의 문서로 구성되어 있습니다. 질문과 문서는 Baidu Search와 Baidu Knows를 기반으로 하며, 답변은 수동으로 생성됩니다. 이 데이터 세트는 또한 질문 유형에 대한 주석을 제공하며, 각 질문에는 엔터티, 설명, 예/아니오, 사실 또는 의견과 같은 범주가 수동으로 레이블됩니다.
DuReader.torrent
시딩 1다운로드 중 1완료됨 324총 다운로드 횟수 608