XQuAD 교차 언어 질의응답 데이터 세트
XQuAD(Cross-Lingual Question Answering Dataset)는 언어 간 질문 답변 성능을 평가하기 위한 벤치마크 데이터 세트입니다. 이 데이터 세트는 다음에서 제공됩니다. SQuAD v1.1(Rajpurkar 외, 2016)개발 세트는 전문적으로 번역된 240개의 구절과 1,190개의 질문-답변 쌍으로 구성되어 있으며, 스페인어, 독일어, 그리스어, 러시아어, 터키어, 아랍어, 베트남어, 태국어, 중국어, 힌디어 등 10개 언어로 번역되었습니다. 따라서 이 데이터 세트는 11개 언어에 걸쳐 완전히 병렬화될 수 있습니다.
데이터 세트가 어떻게 생성되었는지에 대한 자세한 내용은 논문을 참조하세요. "단일 언어 표현의 언어 간 전환 가능성에 관하여".
XQuAD.torrent
시딩 3다운로드 중 0완료됨 121총 다운로드 횟수 287