ODSQA 开放域口语智能问答数据集

日期

1 年前

大小

52.24 MB

机构

Cornell University

发布地址

github.com

ODSQA (Open-Domain Spoken Question Answering Dataset) 来自 ODSQA: Open-domain Spoken Question Answering Dataset 。 这是一个中文数据集,另外还提供了一个英文数据集 Spoken-SQuAD,可以在这里找到。

Spoken-SQuAD  是一个口语智能问答语料库,它通过 Google 的文本转语音 (TTS) 系统从 SQuAD 数据集生成。虽然 Spoken-SQuAD 的规模足以训练最先进的智能问答模型,但它是人工生成的,因此仍然与真实的口语问答存在一定差距。所以,研究人员发布了一个包含三千多个问题的 SQA 数据集,名为 ODSQA 。它是目前用于基于抽取的智能问答任务的最大真实 SQA 数据集。

ODSQA.torrent

做种 1

下载中 0

已完成 60

总下载 288

  • ODSQA/
    • DRCD-TTS.json
      10.15 MB
    • DRCD-backtrans.json
      23.2 MB
    • ODSQA_spokenq_test-v1.1.json
      25.05 MB
    • ODSQA_textq_test-v1.1.json
      26.11 MB
    • README.md
      26.12 MB
    • README.txt
      26.12 MB
      • data/
        • DRCD-TTS.json
          36.27 MB
        • DRCD-backtrans.json
          49.32 MB
        • ODSQA_spokenq_test-v1.1.json
          51.17 MB
        • ODSQA_textq_test-v1.1.json
          52.23 MB
        • README.md
          52.24 MB
        • download.sh
          52.24 MB
    • download.sh
      52.24 MB