HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Dialogue DuConv

Date

il y a 3 ans

Taille

11.76 MB

Organisation

Baidu

URL de publication

ai.baidu.com

URL de l'article

aclanthology.org

Licence

Non-Commercial

DuConv est un ensemble de données basé sur le domaine du cinéma et des stars, comprenant des informations telles que le box-office, le réalisateur et les critiques.

L'ensemble de données comprend 30 000 dialogues et environ 120 000 tours de dialogue. Parmi eux, 20 000 dialogues sont utilisés comme ensembles d'entraînement, 2 000 dialogues sont utilisés comme ensembles de développement et 8 000 dialogues sont utilisés pour construire des échantillons de test. Chaque dialogue de l'ensemble de dialogues et de l'ensemble de développement contient l'objectif du dialogue, les connaissances de base et les détails du dialogue.

Exemple de données :

Remarque : l’ensemble d’apprentissage et l’ensemble de développement sont fournis au format JSON comme suit :

{
  "goal": [
    [
      "START",
      "阳光灿烂的日子",
      "王朔"
    ],
    [
      "王朔",
      "代表作",
      "阳光灿烂的日子"
    ]
  ],
  "knowledge": [
    [
      "阳光灿烂的日子",
      "时光网 短评",
      "70 年代 少年 人 的 成长 经历 , 太 过 真实 , 再回首 至于 刺眼 的 日光 灼 目"
    ],
    [
      "阳光灿烂的日子",
      "主演",
      "宁静"
    ],
    [
      "阳光灿烂的日子",
      "上映 时间",
      "1994 年 9 月 9 日"
    ],
    [
      "阳光灿烂的日子",
      "类型",
      "剧情"
    ],
    [
      "阳光灿烂的日子",
      "领域",
      "电影"
    ],
    [
      "王朔",
      "评论",
      "才华横溢 !"
    ],
    [
      "王朔",
      "毕业 院校",
      "北京四十四中学"
    ],
    [
      "王朔",
      "主要 成就",
      "第 53 届洛迦诺国际电影节 主 竞赛 单元 - 金豹奖"
    ],
    [
      "王朔",
      "性别",
      "男"
    ],
    [
      "王朔",
      "职业",
      "编剧"
    ],
    [
      "王朔",
      "领域",
      "明星"
    ],
    [
      "阳光灿烂的日子",
      "是否 上映",
      "已 上映"
    ],
    [
      "阳光灿烂的日子",
      "时光网 短评",
      "有点 西西里 的 感觉 。"
    ],
    [
      "阳光灿烂的日子",
      "时光网 评分",
      "8.5"
    ],
    [
      "阳光灿烂的日子",
      "导演",
      "姜文"
    ]
  ],
  "conversation": [
    "我 发现 姜文 的 电影 产量 不 高 , 但是 质量 都 挺 高 的 。",
    "同感 , 那 你 觉得 你 印象 最深 的 一部 姜文 的 作品 是 什么 ?",
    "阳光灿烂的日子 吧 , 有点 西西里 的 感觉 。",
    "我 也 觉得 这部 电影 不错 !",
    "嗯 呀 , 它 是 一个 年代 的 缩影 吧 。",
    "对 呀 , 可能 姜文 只是 把 他 自己 经历 的 给 拍 了 出来 吧 。",
    "但是 里面 那位 主演 真 的 是 才华横溢 。",
    "你 说 的 是 哪 一位 ?"
    "王朔 啊 , 是 北京四十四中学 毕业 的 那位 。"
  ]
}

Remarque : l’ensemble de tests est également au format JSON, comme indiqué ci-dessous

{
  "goal": [
    [
      "START",
      "阳光灿烂的日子",
      "王朔"
    ],
    [
      "王朔",
      "代表作",
      "阳光灿烂的日子"
    ]
  ],
  "knowledge": [
    [
      "阳光灿烂的日子",
      "时光网 短评",
      "70 年代 少年 人 的 成长 经历 , 太 过 真实 , 再回首 至于 刺眼 的 日光 灼 目"
    ],
    [
      "阳光灿烂的日子",
      "主演",
      "宁静"
    ],
    [
      "阳光灿烂的日子",
      "上映 时间",
      "1994 年 9 月 9 日"
    ],
    [
      "阳光灿烂的日子",
      "类型",
      "剧情"
    ],
    [
      "阳光灿烂的日子",
      "领域",
      "电影"
    ],
    [
      "王朔",
      "评论",
      "才华横溢 !"
    ],
    [
      "王朔",
      "毕业 院校",
      "北京四十四中学"
    ],
    [
      "王朔",
      "主要 成就",
      "第 53 届洛迦诺国际电影节 主 竞赛 单元 - 金豹奖"
    ],
    [
      "王朔",
      "性别",
      "男"
    ],
    [
      "王朔",
      "职业",
      "编剧"
    ],
    [
      "王朔",
      "领域",
      "明星"
    ],
    [
      "阳光灿烂的日子",
      "是否 上映",
      "已 上映"
    ],
    [
      "阳光灿烂的日子",
      "时光网 短评",
      "有点 西西里 的 感觉 。"
    ],
    [
      "阳光灿烂的日子",
      "时光网 评分",
      "8.5"
    ],
    [
      "阳光灿烂的日子",
      "导演",
      "姜文"
    ]
  ],
  "history": [
    "我 发现 姜文 的 电影 产量 不 高 , 但是 质量 都 挺 高 的 。",
    "同感 , 那 你 觉得 你 印象 最深 的 一部 姜文 的 作品 是 什么 ?"
  ],
  "response": "阳光灿烂的日子 吧 , 有点 西西里 的 感觉 。"
}
DuConv.torrent
Partage 3Téléchargement 0Terminés 646Téléchargements totaux 710
  • DuConv/
    • README.md
      6.53 KB
    • README.txt
      13.05 KB
      • data/
        • dev.txt.gz
          734.36 KB
        • test_1.txt.gz
          2.13 MB
        • test_2.txt.gz
          4.77 MB
        • train.txt.gz
          11.76 MB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp