HyperAI超神经

CoSER 角色扮演数据集

日期

1 个月前

大小

1.53 GB

机构

复旦大学

发布地址

github.com

许可协议

MIT

CoSER (Coordinating LLM-Based Persona Simulation of Established Roles) 数据集是一个专注于角色扮演的大型真实数据集,由复旦大学和阶跃星辰于 2025 年合作构建,相关论文成果为「CoSER: Coordinating LLM-Based Persona Simulation of Established Roles」。它从世界最知名的 771 本书中提取数据,涵盖了 17,966 个角色和 29,798 段真实的对话。与以往的数据集不同,CoSER 数据集不仅包含角色概述和对话,还提供了剧情摘要、角色经历以及对话背景等丰富内容。此外,对话内容涵盖了语言、动作和想法三个维度,使角色表现更加立体。 CoSER 数据集的独特之处在于其真实性和全面性,它从经典文学作品中提取真实角色对话,保留了对话的复杂性,是天然的多轮、多角色的优质对话数据。

来自 CoSER 数据集的一个示例,该数据集提供全面的数据类型,例如对话和设置、情节摘要、人物内心想法,真实来源于知名书籍。
CoSER.torrent
做种 0正在下载 1已完成 20总下载次数 57
  • CoSER/
    • README.md
      1.76 KB
    • README.txt
      3.51 KB
      • data/
        • CoSER.zip
          1.53 GB