CoSQL 对话式文本转 SQL 数据集

日期

4 个月前

大小

100.44 MB

机构

Yale University

CoSQL (Conversational Text-to-SQL Challenge) 数据集是由耶鲁大学在 EMNLP2019 提出的,旨在构建跨领域、通用数据库查询对话系统的数据集。

CoSQL 包含 3k+ 组对话,共计 10k+ 个标注过的 SQL 查询,内容横跨 200 个数据库,且不同组数据所用到的数据库没有交集,以考察模型的鲁棒性。数据集模拟了真实场景中的数据库查询,用户的询问可能有多轮,要求系统具备整合信息的能力。

CoSQL 包含 3 个任务:

  • SQL-grounded dialogue state tracking:根据交互历史,转化成对应的 SQL 语句。
  • Natural language response generation:以 SQL 语句和返回结果为基础,生成自然语言回答。
  • User dialogue act prediction:对每个用户的提问,判断属于哪个 DB 用户标签。
CoSQL.torrent

做种 4

下载中 0

已完成 22

总下载 36

  • CoSQL/
    • README.md
      1.54 KB
    • README.txt
      3.09 KB
      • data/
        • cosql_dataset.zip
          100.44 MB