HyperAI초신경

XQuAD 교차 언어 질의응답 데이터 세트

날짜

일 년 전

크기

14 MB

기관

라이선스

CC BY 4.0

XQuAD(Cross-Lingual Question Answering Dataset)는 언어 간 질문 답변 성능을 평가하기 위한 벤치마크 데이터 세트입니다. 이 데이터 세트는 다음에서 제공됩니다. SQuAD v1.1(Rajpurkar 외, 2016)개발 세트는 전문적으로 번역된 240개의 구절과 1,190개의 질문-답변 쌍으로 구성되어 있으며, 스페인어, 독일어, 그리스어, 러시아어, 터키어, 아랍어, 베트남어, 태국어, 중국어, 힌디어 등 10개 언어로 번역되었습니다. 따라서 이 데이터 세트는 11개 언어에 걸쳐 완전히 병렬화될 수 있습니다.

데이터 세트가 어떻게 생성되었는지에 대한 자세한 내용은 논문을 참조하세요. "단일 언어 표현의 언어 간 전환 가능성에 관하여".

XQuAD.torrent
시딩 3다운로드 중 0완료됨 121총 다운로드 횟수 287
  • XQuAD/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • CC-BY-SA4.0.txt
          17.28 KB
        • README.md
          24.8 KB
        • xquad.ar.json
          1.53 MB
        • xquad.de.json
          2.17 MB
        • xquad.el.json
          4 MB
        • xquad.en.json
          4.58 MB
        • xquad.es.json
          5.24 MB
        • xquad.hi.json
          6.84 MB
        • xquad.ro.json
          7.47 MB
        • xquad.ru.json
          9.28 MB
        • xquad.th.json
          11 MB
        • xquad.tr.json
          11.7 MB
        • xquad.vi.json
          12.57 MB
        • xquad.zh.json
          13.34 MB
        • xquad_example.png
          14 MB