HyperAI초신경

TriviaQA는 65만 개 이상의 질문-답변 증거 3부작을 포함하는 독해 이해 데이터 세트입니다. TriviaQA에는 Wikipedia와 웹의 662,000개 문서에서 추출한 950,000개의 질문-답변 쌍이 포함되어 있습니다. 이 데이터 세트는 SQuAD(Stanford Question Answering Dataset)와 같은 표준 QA 벤치마크보다 더 어렵습니다. 왜냐하면 질문에 대한 답변이 범위 예측을 통해 직접 얻어지지 않을 수 있고 컨텍스트가 길기 때문입니다. TriviaQA 데이터 세트는 사람이 검증한 QA 하위 집합과 기계가 생성한 QA 하위 집합으로 구성됩니다. 자세한 내용은 ACL 17 문서에서 확인할 수 있습니다.TriviaQA: 독해를 위한 대규모 원격 지도 학습 챌린지 데이터 세트"