HyperAI超神经

OpenThoughts3-1.2M 推理数据集

日期

5 days ago

发布地址

huggingface.co

下载帮助

OpenThoughts3-1.2M 是一个开源的推理数据集,该数据集由 Open Thoughts 于 2025 年发布,是 OpenThoughts 数据集系列的第 3 次迭代,相关论文成果为:「OpenThoughts: Data Recipes for Reasoning Models」。

该数据集包含 85 万个数学问题、 25 万个代码问题和 10 万个科学问题,注释使用 QwQ-32B 模型完成。

数据集框架