XQuAD(跨语言问答数据集)是一个用于评估跨语言问答性能的基准数据集。该数据集由 SQuAD v1.1(Rajpurkar 等,2016)开发集中的 240 段落和 1,190 个问题-答案对的子集组成,它们被翻译成了十种语言的专业译文:西班牙语、德语、希腊语、俄语、土耳其语、阿拉伯语、越南语、泰语、中文和印地语。因此,该数据集在 11 种语言之间可以完全平行使用。
有关数据集创建方式的详细信息请参阅论文 「On the Cross-lingual Transferability of Monolingual Representations」。
做种 1
下载中 0
已完成 46
总下载 222