Ensemble De Données De Questions-réponses Multilingues XQuAD
Date
Taille
Licence
CC BY 4.0
XQuAD (Cross-Lingual Question Answering Dataset) est un ensemble de données de référence pour évaluer les performances de réponse aux questions multilingues. Cet ensemble de données est fourni par SQuAD v1.1 (Rajpurkar et al., 2016)L'ensemble de développement comprend un sous-ensemble de 240 passages et 1 190 paires questions-réponses qui ont été traduits professionnellement en dix langues : espagnol, allemand, grec, russe, turc, arabe, vietnamien, thaï, chinois et hindi. Par conséquent, l’ensemble de données est entièrement parallélisable dans les 11 langues.
Pour plus de détails sur la façon dont l'ensemble de données a été créé, veuillez vous référer au document « Sur la transférabilité interlinguistique des représentations monolingues ».