HyperAI

Ensemble De Données De Questions-réponses Multilingues XQuAD

XQuAD (Cross-Lingual Question Answering Dataset) est un ensemble de données de référence pour évaluer les performances de réponse aux questions multilingues. Cet ensemble de données est fourni par SQuAD v1.1 (Rajpurkar et al., 2016)L'ensemble de développement comprend un sous-ensemble de 240 passages et 1 190 paires questions-réponses qui ont été traduits professionnellement en dix langues : espagnol, allemand, grec, russe, turc, arabe, vietnamien, thaï, chinois et hindi. Par conséquent, l’ensemble de données est entièrement parallélisable dans les 11 langues.

Pour plus de détails sur la façon dont l'ensemble de données a été créé, veuillez vous référer au document « Sur la transférabilité interlinguistique des représentations monolingues ».

XQuAD.torrent
Partage 2Téléchargement 0Terminés 121Téléchargements totaux 287
  • XQuAD/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • CC-BY-SA4.0.txt
          17.28 KB
        • README.md
          24.8 KB
        • xquad.ar.json
          1.53 MB
        • xquad.de.json
          2.17 MB
        • xquad.el.json
          4 MB
        • xquad.en.json
          4.58 MB
        • xquad.es.json
          5.24 MB
        • xquad.hi.json
          6.84 MB
        • xquad.ro.json
          7.47 MB
        • xquad.ru.json
          9.28 MB
        • xquad.th.json
          11 MB
        • xquad.tr.json
          11.7 MB
        • xquad.vi.json
          12.57 MB
        • xquad.zh.json
          13.34 MB
        • xquad_example.png
          14 MB