XQuAD クロスランゲージ質問応答データセット

XQuAD (Cross-Language Question Answering Dataset) は、異言語質問応答パフォーマンスを評価するためのベンチマーク データセットです。このデータセットは次のもので構成されています SQuAD v1.1 (Rajpurkar 他、2016)これは、開発セットからの 240 のパッセージと 1,190 の質問と回答のペアのサブセットで構成されており、スペイン語、ドイツ語、ギリシャ語、ロシア語、トルコ語、アラビア語、ベトナム語、タイ語、中国語、ヒンディー語の 10 言語で専門的な翻訳が行われています。したがって、データセットは 11 の言語にわたって完全に並列化できます。

データセットの作成方法の詳細については、論文を参照してください。 「単一言語表現の言語を越えた移転可能性について」

XQuAD.torrent

做种 2

下载中 0

已完成 46

总下载 222

  • XQuAD/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • CC-BY-SA4.0.txt
          17.28 KB
        • README.md
          24.8 KB
        • xquad.ar.json
          1.53 MB
        • xquad.de.json
          2.17 MB
        • xquad.el.json
          4 MB
        • xquad.en.json
          4.58 MB
        • xquad.es.json
          5.24 MB
        • xquad.hi.json
          6.84 MB
        • xquad.ro.json
          7.47 MB
        • xquad.ru.json
          9.28 MB
        • xquad.th.json
          11 MB
        • xquad.tr.json
          11.7 MB
        • xquad.vi.json
          12.57 MB
        • xquad.zh.json
          13.34 MB
        • xquad_example.png
          14 MB