KdConv 中文多领域知识驱动的会话数据集

日期

1 年前

大小

45.15 MB

机构

清华大学

许可协议

其他

KdConv 全称 Chinese multi-domain Knowledge-driven Conversation dataset,是一个中文多领域知识驱动的对话数据集,将多轮对话中的主题建立在知识图谱上。 KdConv 包含来自三个领域(电影、音乐和旅行)的 4.5 K 个对话,以及平均转数为 19.0 的 86 K 个话语。
该语料库是一个针对多转向知识驱动对话的中国多领域数据集,适用于对多转向人类对话中的知识交互进行建模,包括知识规划,知识基础,知识适应等。

KdConv.torrent

做种 1

下载中 0

已完成 51

总下载 388

  • KdConv/
    • README.md
      1.25 KB
    • README.txt
      2.51 KB
      • data/
        • README.md
          3.33 KB
          • film/
            • dev.json
              1.3 MB
            • kb_film.json
              13.73 MB
            • test.json
              15.21 MB
            • train.json
              22.74 MB
          • music/
            • dev.json
              23.64 MB
            • kb_music.json
              30.75 MB
            • test.json
              31.84 MB
            • train.json
              36.57 MB
          • travel/
            • dev.json
              37.43 MB
            • kb_travel.json
              39.18 MB
            • test.json
              40.23 MB
            • train.json
              45.15 MB