XQuAD 跨语言问答数据集

日期

1 年前

大小

14 MB

机构

许可协议

CC BY 4.0

XQuAD(跨语言问答数据集)是一个用于评估跨语言问答性能的基准数据集。该数据集由 SQuAD v1.1(Rajpurkar 等,2016)开发集中的 240 段落和 1,190 个问题-答案对的子集组成,它们被翻译成了十种语言的专业译文:西班牙语、德语、希腊语、俄语、土耳其语、阿拉伯语、越南语、泰语、中文和印地语。因此,该数据集在 11 种语言之间可以完全平行使用。

有关数据集创建方式的详细信息请参阅论文 「On the Cross-lingual Transferability of Monolingual Representations」

XQuAD.torrent

做种 1

下载中 0

已完成 46

总下载 222

  • XQuAD/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • CC-BY-SA4.0.txt
          17.28 KB
        • README.md
          24.8 KB
        • xquad.ar.json
          1.53 MB
        • xquad.de.json
          2.17 MB
        • xquad.el.json
          4 MB
        • xquad.en.json
          4.58 MB
        • xquad.es.json
          5.24 MB
        • xquad.hi.json
          6.84 MB
        • xquad.ro.json
          7.47 MB
        • xquad.ru.json
          9.28 MB
        • xquad.th.json
          11 MB
        • xquad.tr.json
          11.7 MB
        • xquad.vi.json
          12.57 MB
        • xquad.zh.json
          13.34 MB
        • xquad_example.png
          14 MB