ODSQA (Open-Domain Spoken Question Answering Dataset) 来自 ODSQA: Open-domain Spoken Question Answering Dataset 。 这是一个中文数据集,另外还提供了一个英文数据集 Spoken-SQuAD,可以在这里找到。
Spoken-SQuAD 是一个口语智能问答语料库,它通过 Google 的文本转语音 (TTS) 系统从 SQuAD 数据集生成。虽然 Spoken-SQuAD 的规模足以训练最先进的智能问答模型,但它是人工生成的,因此仍然与真实的口语问答存在一定差距。所以,研究人员发布了一个包含三千多个问题的 SQA 数据集,名为 ODSQA 。它是目前用于基于抽取的智能问答任务的最大真实 SQA 数据集。
做种 1
下载中 0
已完成 60
总下载 288