MSMARCO 기계 독해 데이터 세트
MSMARCO는 Bing의 검색 쿼리 로그에서 추출한 익명 질문 1,010,916개와 AI가 생성한 답변, 그리고 사람이 다시 작성한 답변 182,669개를 포함하는 기계 독해 이해 데이터 세트입니다. 이 데이터 세트에는 또한 3,563,535개 문서에서 추출한 8,841,823개의 문단이 포함되어 있습니다.
MSMARCO 데이터 세트는 Microsoft에서 2016년에 공개하고 2018년에 업데이트되었습니다. 또한, 이 데이터 세트에는 해당 순위 경쟁이 있습니다.
MSMARCO.torrent
시딩 2다운로드 중 0완료됨 1,038총 다운로드 횟수 1,418