随着中文大模型的快速发展,能力在不断提升,越来越多的人开始担心它们可能带来风险。因此,围绕中文大模型的价值观评估、价值观对齐得到了极大的关注。为了促进这个方向的研究,通义实验室开源了 CValues-Comparison 数据集,这是一个包含 145k 的价值观比较样本数据集,每个样本包含 prompt,正例回复、负例回复。
数据构建方法可以详见论文 「CVALUES: Measuring the Values of Chinese Large Language Models from Safety to Responsibility」
做种 1
下载中 0
已完成 29
总下载 79