XQuAD (Cross-Language Question Answering Dataset) は、異言語質問応答パフォーマンスを評価するためのベンチマーク データセットです。このデータセットは次のもので構成されています SQuAD v1.1 (Rajpurkar 他、2016)これは、開発セットからの 240 のパッセージと 1,190 の質問と回答のペアのサブセットで構成されており、スペイン語、ドイツ語、ギリシャ語、ロシア語、トルコ語、アラビア語、ベトナム語、タイ語、中国語、ヒンディー語の 10 言語で専門的な翻訳が行われています。したがって、データセットは 11 の言語にわたって完全に並列化できます。
データセットの作成方法の詳細については、論文を参照してください。 「単一言語表現の言語を越えた移転可能性について」。
做种 2
下载中 0
已完成 46
总下载 222