CoSER (Coordinating LLM-Based Persona Simulation of Established Roles) 数据集是一个专注于角色扮演的大型真实数据集,由复旦大学和阶跃星辰于 2025 年合作构建,相关论文成果为「CoSER: Coordinating LLM-Based Persona Simulation of Established Roles」。它从世界最知名的 771 本书中提取数据,涵盖了 17,966 个角色和 29,798 段真实的对话。与以往的数据集不同,CoSER 数据集不仅包含角色概述和对话,还提供了剧情摘要、角色经历以及对话背景等丰富内容。此外,对话内容涵盖了语言、动作和想法三个维度,使角色表现更加立体。 CoSER 数据集的独特之处在于其真实性和全面性,它从经典文学作品中提取真实角色对话,保留了对话的复杂性,是天然的多轮、多角色的优质对话数据。

CoSER.torrent
做种 0正在下载 1已完成 20总下载次数 57