KodCode-V1 编码合成数据集
KodCode 由微软 GenAI 、华盛顿大学、德克萨斯大学奥斯汀分校的研究人员于 2025 年发布,相关论文成果为「KodCode : A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding」。
该数据集是最大的全合成开源数据集,为编码任务提供可验证的解决方案和测试,包含 12 个不同的子集,涵盖各个领域(从算法到特定于软件包的知识)和难度级别(从基本的编码练习到面试和竞争性编程挑战),专为监督微调 (SFT) 和 RL 调优而设计。

KodCode-V1.torrent
做种 1正在下载 1已完成 20总下载次数 24