DuConv 대화 데이터 세트
DuConv는 박스오피스, 감독, 리뷰 등의 정보를 포함하는 영화 및 스타 도메인을 기반으로 한 데이터 세트입니다.
이 데이터 세트에는 3만 개의 대화와 약 12만 개의 대화 턴이 포함되어 있습니다. 그 중 20k개의 대화는 학습 세트로, 2k개의 대화는 개발 세트로, 8k개의 대화는 테스트 샘플을 구성하는 데 사용되었습니다. 대화 세트와 개발 세트의 각 대화에는 대화의 목적, 배경 지식, 대화 세부 정보가 포함되어 있습니다.
예시 데이터:
참고: 훈련 세트와 개발 세트는 다음과 같이 JSON 형식으로 제공됩니다.
{
"goal": [
[
"START",
"阳光灿烂的日子",
"王朔"
],
[
"王朔",
"代表作",
"阳光灿烂的日子"
]
],
"knowledge": [
[
"阳光灿烂的日子",
"时光网 短评",
"70 年代 少年 人 的 成长 经历 , 太 过 真实 , 再回首 至于 刺眼 的 日光 灼 目"
],
[
"阳光灿烂的日子",
"主演",
"宁静"
],
[
"阳光灿烂的日子",
"上映 时间",
"1994 年 9 月 9 日"
],
[
"阳光灿烂的日子",
"类型",
"剧情"
],
[
"阳光灿烂的日子",
"领域",
"电影"
],
[
"王朔",
"评论",
"才华横溢 !"
],
[
"王朔",
"毕业 院校",
"北京四十四中学"
],
[
"王朔",
"主要 成就",
"第 53 届洛迦诺国际电影节 主 竞赛 单元 - 金豹奖"
],
[
"王朔",
"性别",
"男"
],
[
"王朔",
"职业",
"编剧"
],
[
"王朔",
"领域",
"明星"
],
[
"阳光灿烂的日子",
"是否 上映",
"已 上映"
],
[
"阳光灿烂的日子",
"时光网 短评",
"有点 西西里 的 感觉 。"
],
[
"阳光灿烂的日子",
"时光网 评分",
"8.5"
],
[
"阳光灿烂的日子",
"导演",
"姜文"
]
],
"conversation": [
"我 发现 姜文 的 电影 产量 不 高 , 但是 质量 都 挺 高 的 。",
"同感 , 那 你 觉得 你 印象 最深 的 一部 姜文 的 作品 是 什么 ?",
"阳光灿烂的日子 吧 , 有点 西西里 的 感觉 。",
"我 也 觉得 这部 电影 不错 !",
"嗯 呀 , 它 是 一个 年代 的 缩影 吧 。",
"对 呀 , 可能 姜文 只是 把 他 自己 经历 的 给 拍 了 出来 吧 。",
"但是 里面 那位 主演 真 的 是 才华横溢 。",
"你 说 的 是 哪 一位 ?"
"王朔 啊 , 是 北京四十四中学 毕业 的 那位 。"
]
}
참고: 테스트 세트는 아래와 같이 JSON 형식이기도 합니다.
{
"goal": [
[
"START",
"阳光灿烂的日子",
"王朔"
],
[
"王朔",
"代表作",
"阳光灿烂的日子"
]
],
"knowledge": [
[
"阳光灿烂的日子",
"时光网 短评",
"70 年代 少年 人 的 成长 经历 , 太 过 真实 , 再回首 至于 刺眼 的 日光 灼 目"
],
[
"阳光灿烂的日子",
"主演",
"宁静"
],
[
"阳光灿烂的日子",
"上映 时间",
"1994 年 9 月 9 日"
],
[
"阳光灿烂的日子",
"类型",
"剧情"
],
[
"阳光灿烂的日子",
"领域",
"电影"
],
[
"王朔",
"评论",
"才华横溢 !"
],
[
"王朔",
"毕业 院校",
"北京四十四中学"
],
[
"王朔",
"主要 成就",
"第 53 届洛迦诺国际电影节 主 竞赛 单元 - 金豹奖"
],
[
"王朔",
"性别",
"男"
],
[
"王朔",
"职业",
"编剧"
],
[
"王朔",
"领域",
"明星"
],
[
"阳光灿烂的日子",
"是否 上映",
"已 上映"
],
[
"阳光灿烂的日子",
"时光网 短评",
"有点 西西里 的 感觉 。"
],
[
"阳光灿烂的日子",
"时光网 评分",
"8.5"
],
[
"阳光灿烂的日子",
"导演",
"姜文"
]
],
"history": [
"我 发现 姜文 的 电影 产量 不 高 , 但是 质量 都 挺 高 的 。",
"同感 , 那 你 觉得 你 印象 最深 的 一部 姜文 的 作品 是 什么 ?"
],
"response": "阳光灿烂的日子 吧 , 有点 西西里 的 感觉 。"
}
DuConv.torrent
시딩 1다운로드 중 1완료됨 469총 다운로드 횟수 562