HyperAIHyperAI

Command Palette

Search for a command to run...

ODSQA 开放域口语智能问答数据集

Date

2 年前

Size

52.24 MB

Organization

Cornell University

Publish URL

github.com

Paper URL

arxiv.org

ODSQA (Open-Domain Spoken Question Answering Dataset) 来自 ODSQA: Open-domain Spoken Question Answering Dataset 。 这是一个中文数据集,另外还提供了一个英文数据集 Spoken-SQuAD,可以在这里找到。

Spoken-SQuAD  是一个口语智能问答语料库,它通过 Google 的文本转语音 (TTS) 系统从 SQuAD 数据集生成。虽然 Spoken-SQuAD 的规模足以训练最先进的智能问答模型,但它是人工生成的,因此仍然与真实的口语问答存在一定差距。所以,研究人员发布了一个包含三千多个问题的 SQA 数据集,名为 ODSQA 。它是目前用于基于抽取的智能问答任务的最大真实 SQA 数据集。

ODSQA.torrent
Seeding 2Downloading 0Completed 272Total Downloads 542
  • ODSQA/
    • DRCD-TTS.json
      10.15 MB
    • DRCD-backtrans.json
      23.2 MB
    • ODSQA_spokenq_test-v1.1.json
      25.05 MB
    • ODSQA_textq_test-v1.1.json
      26.11 MB
    • README.md
      26.12 MB
    • README.txt
      26.12 MB
      • data/
        • DRCD-TTS.json
          36.27 MB
        • DRCD-backtrans.json
          49.32 MB
        • ODSQA_spokenq_test-v1.1.json
          51.17 MB
        • ODSQA_textq_test-v1.1.json
          52.23 MB
        • README.md
          52.24 MB
        • download.sh
          52.24 MB
    • download.sh
      52.24 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供