该数据集旨在训练推理模型,让模型可以像人类一样思考复杂的问题,然后再做出反应。数据集包括来自不同领域(科学、编码、数学等)的各种问题,每个问题都有详细的思路链 (COT) 和正确答案。目标是使模型能够学习和改进其推理过程,识别和纠正错误,并提供高质量、详细的响应。该数据集目前仍在开发中。
数据集结构
数据字段
- User:用户的查询或问题陈述。
- assistant:问题的正确答案。
- reasoning:解释如何得出正确答案的详细的、逐步的推理过程。
- template:预先应用的 RChatML 聊天模板。
reasoning-base-20k.torrent
做种 2正在下载 0已完成 68总下载次数 107