CoSQL 对话式文本转 SQL 数据集
CoSQL (Conversational Text-to-SQL Challenge) 数据集是由耶鲁大学在 EMNLP2019 提出的,旨在构建跨领域、通用数据库查询对话系统的数据集。
CoSQL 包含 3k+ 组对话,共计 10k+ 个标注过的 SQL 查询,内容横跨 200 个数据库,且不同组数据所用到的数据库没有交集,以考察模型的鲁棒性。数据集模拟了真实场景中的数据库查询,用户的询问可能有多轮,要求系统具备整合信息的能力。
CoSQL 包含 3 个任务:
- SQL-grounded dialogue state tracking:根据交互历史,转化成对应的 SQL 语句。
- Natural language response generation:以 SQL 语句和返回结果为基础,生成自然语言回答。
- User dialogue act prediction:对每个用户的提问,判断属于哪个 DB 用户标签。

CoSQL.torrent
做种 1正在下载 1已完成 43总下载次数 66