Command Palette

Search for a command to run...

OpenCodeReasoning 编程推理数据集

日期

6 个月前

大小

8.11 GB

机构

NVIDIA(英伟达)

论文链接

arxiv.org

OpenCodeReasoning 是由 NVIDIA 于 2025 年发布的大规模编程推理合成数据集,旨在为大语言模型(LLMs)提供高质量的编程推理训练数据,推动代码生成与逻辑推理能力的提升。相关论文成果为:「OpenCodeReasoning: Advancing Data Distillation for Competitive Coding」。

该数据集包含了 735,255 个样本,覆盖 28,319 道独特的编程题目,是当前最大的推理型编程数据集之一。

数据来源:

  • 整合了 CodeForces 、 CodeChef 、 LeetCode 等 11 个主流编程平台的题目,包括 TACO 、 APPS 、 CodeContests 等公开数据集。
  • 代码响应由 NVIDIA 自研模型 R1 生成,以确保数据的一致性与推理逻辑的规范性。
OpenCodeReasoning.torrent
做种 2正在下载 0已完成 81总下载次数 141
  • OpenCodeReasoning/
    • README.md
      1.49 KB
    • README.txt
      2.98 KB
      • data/
        • OpenCodeReasoning.zip
          8.11 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供