Douban Conversation Corpus 豆瓣会话语料库

日期

1 年前

大小

683.06 MB

机构

北京航空航天大学

发布地址

github.com

许可协议

其他

本数据集包括一个训练数据集、一个开发集和一个基于检索的聊天机器人的测试集。测试数据包含 1,000 个对话上下文,对于每个上下文,研究人员创建 10 个响应作为候选。研究人员招募了三名标注员来判断候选人是否对会议做出了适当的回应,正确的响应意味着响应可以自然地回复给定上下文的消息。每对收到三个标签,大部分标签被视为最终决定。

Douban.torrent

做种 1

下载中 0

已完成 68

总下载 316

  • Douban/
    • README.md
      1.29 KB
    • README.txt
      2.57 KB
      • data/
        • README.md
          3.28 KB
        • dev.txt
          32.43 MB
        • test.txt
          39.42 MB
        • train.txt
          683.06 MB